ถอดบทเรียนคลาวด์ยักษ์ล้ม กับความสำคัญของ Data Recovery

ธุรกิจไอที

ถอดบทเรียนคลาวด์ยักษ์ล้ม กับความสำคัญของ Data Recovery

21 ตุลาคม 2568

20 ต.ค.68 ระบบคลาวด์ของ Amazon Web Services (AWS) ล่มทั่วโลกนานกว่า 3 ชั่วโมง เว็บไซต์และแอปฯใหญ่ ๆ อย่าง Snapchat, Reddit, Venmo, Duolingo, Fortnite และ Prime Video ของ Amazon เองก็หยุดทำงานพร้อมกัน โดย AWS ยืนยันว่าเกิดจากความผิดพลาดภายในระบบ ไม่ใช่การโจมตีไซเบอร์

ถ้าไม่ได้โดนโจมตี ทำไมระบบที่ใหญ่และลงทุนมหาศาลถึงกู้ระบบกลับมาได้ช้า?

ศูนย์ข้อมูลของ AWS ใหญ่ระดับที่ถือว่าเป็น “หลังบ้านของอินเทอร์เน็ตโลก” มีศูนย์ข้อมูลกระจายอยู่ทั่วโลก พร้อมระบบสำรองที่ออกแบบมาเพื่อให้ทำงานต่อเนื่อง แม้เกิดเหตุไม่คาดคิด อย่าง (Disaster Recovery Plan) และ Data Continuity ที่ทดสอบและประเมินแผนเป็นประจำ เพื่อให้มั่นใจว่าสามารถกู้คืนระบบได้จริง

แต่เหตุการณ์ครั้งนี้กลับใช้เวลานานกว่าจะกลับมาเป็นปกติ ทำให้หลายฝ่ายเริ่มตั้งคำถามว่าแผนกู้ระบบที่ลงทุนมหาศาลนั้น พร้อมใช้จริงหรือไม่

สะท้อนถึงช่องโหว่ของการพึ่งพา “ศูนย์ข้อมูลขนาดยักษ์” มากเกินไป เพราะหากเกิดความผิดพลาดเพียงครั้งเดียว อาจส่งผลกระทบต่อทั้งธุรกิจและชีวิตประจำวันของผู้คนทั่วโลกมหาศาล

ส่งผลให้หน่วยงานในยุโรป และสหราชอาณาจักร เตรียมพิจารณาให้ AWS เป็น “โครงสร้างพื้นฐานสำคัญของระบบเศรษฐกิจ” (Critical Third Party) เพื่อบังคับให้มีมาตรการตรวจสอบและเปิดเผยข้อมูลระบบที่โปร่งใสมากขึ้น

เพราะแม้ AWS จะเคยประกาศว่ามี SLA (Service Level Agreement) ที่ใช้เป็นมาตรฐานรับประกันการให้บริการ กว่า 300 รายการ ว่ามีความพร้อมใช้งานและเวลาในการกู้ระบบ

ชี้ให้เห็นว่า SLA อาจไม่ใช่เครื่องประกันว่าระบบที่ล่มจะฟื้นกลับมาได้ทันเวลา จึงเป็นอีกประเด็นที่น่าจับตา เพราะอาจมีการ “ปรับ SLA มหาศาล” หลังเหตุล่มครั้งนี้

เพราะความสำคัญของผู้ให้บริการคลาวด์ต้องไม่ใช่แค่ป้องกันไม่ให้ระบบล่ม แต่ต้องให้ความสำคัญ กับกระบวนการ “Data Recovery” และรักษาความต่อเนื่องของข้อมูล (DCP) ให้ได้จริง และต้องมีการสื่อสารกับลูกค้าอย่างโปร่งใสเมื่อเกิดเหตุขัดข้อง เพราะในโลกที่ข้อมูลคือหัวใจของธุรกิจ การกู้ข้อมูลกลับมาให้เร็วที่สุดคือความรับผิดชอบขั้นพื้นฐานของผู้ให้บริการ

แท็กที่เกี่ยวข้อง

Amazon AWS AWSล่ม datarecovery cloudcomputing Globaltech TechMovement