Nguyên nhân khiến Google Cloud bị sự cố cuối tuần qua
Cuối tuần vừa qua, một sự cố quy mô lớn đã xảy ra trên nền tảng Google Cloud làm gián đoạn tạm thời nhiều dịch vụ internet quan trọng trên toàn thế giới.

Google Cloud hiện chiếm tới 12% thị phần thị trường điện toán đám mây toàn cầu
Sự cố này xảy ra đồng thời tại nhiều khu vực, gồm cả Mỹ, châu Âu và châu Á, ảnh hưởng nghiêm trọng đến các dịch vụ toàn cầu như Spotify, Discord và Snapchat. Theo ghi nhận, các dịch vụ nội bộ của Google như Gmail và Google Drive cũng không thể hoạt động bình thường.
Google chính thức thông báo rằng nguyên nhân của sự cố là do lỗi trong hệ thống quản lý giao diện lập trình ứng dụng (API). Một bản cập nhật hạn ngạch tự động bị sai đã được phân phối trên toàn cầu, khiến hàng loạt yêu cầu API từ bên ngoài bị từ chối. Quá trình khôi phục mất khoảng 7 giờ 30 phút.
Đặc biệt, dịch vụ trí tuệ nhân tạo Vertex AI Online Prediction của Google bị ảnh hưởng nặng nề nhất, với tỷ lệ lỗi cao và tốc độ phục hồi chậm. Ngay sau khi sự cố xảy ra, các trang chuyên báo cáo sự cố như Downdetector đã ghi nhận lượng lớn báo cáo: 44.000 từ người dùng Spotify, 10.000 từ Google Cloud và 8.000 từ Discord.
Ông Thomas Kurian, CEO của Google Cloud, đã lên tiếng: “Chúng tôi xin lỗi tất cả người dùng và khách hàng bị ảnh hưởng bởi sự cố lần này”, đồng thời cam kết sẽ cải thiện hệ thống để ngăn chặn những sự cố tương tự trong tương lai. Google cho biết sẽ công bố báo cáo chính thức về nguyên nhân gốc rễ và các biện pháp phòng ngừa trong vài ngày tới.
Trước đó, vào năm ngoái cũng từng xảy ra sự cố tương tự khi một bản cập nhật lỗi của phần mềm bảo mật CrowdStrike gây ra tình trạng gián đoạn quy mô lớn trên nền tảng Azure của Microsoft. Lúc đó, một lỗi phần mềm bảo mật đã gây ảnh hưởng nghiêm trọng đến hạ tầng đám mây toàn cầu. Tương tự như sự cố của Google Cloud lần này, điều đó cho thấy chỉ một lỗi hệ thống đơn lẻ cũng có thể tạo ra hiệu ứng dây chuyền rất lớn.
Theo công ty nghiên cứu thị trường Synergy Research Group, Google Cloud hiện chiếm 12% thị phần thị trường điện toán đám mây toàn cầu. Sự cố lần này được dự báo sẽ ảnh hưởng đến mức độ tin cậy của nền tảng này trong cuộc cạnh tranh với Amazon Web Services (AWS) và Microsoft Azure. Các hãng truyền thông quốc tế như CNBC cũng nhận định rằng sự cố này đang tạo áp lực lớn lên uy tín của Google Cloud.