DeepSeek giúp Trung Quốc tăng độ cạnh tranh với Mỹ về AI nhưng chưa phải mối đe dọa đáng kể cho OpenAI
Những tiến bộ công nghệ mà công ty khởi nghiệp DeepSeek thể hiện cho thấy cuộc cạnh tranh về trí tuệ nhân tạo (AI) giữa Mỹ và Trung Quốc đã thực sự diễn ra, các giám đốc công nghệ hàng đầu nói với kênh CNBC.
Trong các cuộc phỏng vấn tại Hội nghị Thượng đỉnh Hành động AI của Pháp, lãnh đạo một số hãng công nghệ lớn nói với kênh CNBC rằng sự đột phá của DeepSeek chứng minh rằng Trung Quốc không thể bị loại khỏi cuộc chơi với tư cách là đối thủ đáng gờm về đổi mới AI.
Tháng 12.2024, DeepSeek (có trụ sở tại thành phố Hàng Châu, Trung Quốc) gây chấn động toàn cầu với bài báo kỹ thuật tuyên bố mô hình AI V3 của họ được tạo ra với tổng chi phí đào tạo dưới 6 triệu USD, thấp hơn nhiều so với hàng tỉ USD mà các gã khổng lồ công nghệ và phòng thí nghiệm AI phương Tây như OpenAI và Anthropic đang chi tiêu.
Chris Lehane, Giám đốc các vấn đề toàn cầu tại OpenAI, nói với CNBC rằng mô hình tiên tiến với chi phí đào tạo thấp của DeepSeek xác nhận có một cuộc cạnh tranh rất thực tế về AI giữa Mỹ và Trung Quốc.
"Chỉ có hai quốc gia trên thế giới có thể xây dựng AI ở quy mô lớn, giống như chỉ có hai nước có thể xây dựng hệ thống điện quy mô lớn. Với chúng tôi, DeepSeek thực sự củng cố và khẳng định rằng đây là cuộc cạnh tranh rất thực tế với những lợi ích rất lớn", Chris Lehane nói.
Tuy nhiên, phần lớn các giám đốc công nghệ cho rằng dù bước đột phá của DeepSeek cho thấy Trung Quốc đang tiến xa hơn trong cuộc đua AI toàn cầu so với suy nghĩ từ nhiều người trước đây, nhưng mối đe dọa mà nó gây ra cho OpenAI vẫn còn hạn chế vào thời điểm hiện tại.
"Trò chơi bắt đầu"
DeepSeek cho biết mô hình lý luận mã nguồn mở R1 của họ có thể đạt hiệu suất ngang bằng với o1 của OpenAI nhưng sử dụng quy trình đào tạo rẻ hơn và ít tiêu tốn năng lượng hơn.
Điều đó khiến các chuyên gia đặt câu hỏi về nhận định phổ biến ở phương Tây trong nhiều năm qua rằng Trung Quốc đang tụt hậu so với Mỹ trong phát triển AI do bị hạn chế nhập khẩu các bộ xử lý đồ họa (GPU) tiên tiến từ Nvidia.
GPU rất cần thiết để đào tạo và vận hành ứng dụng AI vì xuất sắc trong việc xử lý song song, tức có thể thực hiện nhiều phép tính cùng lúc.
Reid Hoffman, đồng sáng lập LinkedIn và đối tác tại quỹ đầu tư mạo hiểm Greylock Partners, nói với CNBC rằng các mô hình mới của DeepSeek là "bước tiến lớn cho thấy cuộc chơi đã bắt đầu".
"Cuộc cạnh tranh với Trung Quốc đang diễn ra", Reid Hoffman nói, đồng thời cho biết thêm rằng DeepSeek-R1 là "mô hình đáng tin cậy và có thể áp dụng thực tế".
Abishur Prakash, nhà sáng lập công ty tư vấn chiến lược The Geopolitical Business, nói rằng DeepSeek cho thấy phương Tây vẫn chưa hiểu rõ về Trung Quốc.
"Vị trí mặc định của Mỹ là cường quốc công nghệ số một thế giới không còn là điều hiển nhiên nữa", Abishur Prakash nói trong cuộc phỏng vấn qua điện thoại với CNBC.
"Đây là hiện trạng mới, rằng khoảng cách giữa Mỹ và Trung Quốc đã bị thu hẹp gần như chỉ sau một đêm, nhưng thực tế là nó đã bị rút ngắn qua nhiều năm tiến bộ của quốc gia châu Á này. Nếu có một điều mà phương Tây nên rút ra, đó là sự hiểu biết của họ về Trung Quốc vẫn còn rất hạn chế. Chúng ta không biết điều gì sẽ xảy ra tiếp theo", Abishur Prakash nhận định.

Theo chuyên gia AI hàng đầu, DeepSeek chưa đặt ra bất kỳ rủi ro đáng kể nào với hoạt động kinh doanh của OpenAI ở thời điểm hiện tại - Ảnh: Internet
"Chưa phải là mối đe dọa đáng kể với OpenAI"
Các chuyên gia AI hàng đầu tin rằng DeepSeek chưa đặt ra bất kỳ rủi ro đáng kể nào với hoạt động kinh doanh của OpenAI và Anthropic ở thời điểm hiện tại.
Dù các chuyên gia đều đồng ý rằng những tiến bộ của DeepSeek trong AI là ấn tượng, nhưng vẫn có những nghi ngờ về tuyên bố của công ty này liên quan đến chi phí đào tạo mô hình.
Một báo cáo từ hãng nghiên cứu bán dẫn SemiAnalysis (Mỹ) ước tính rằng tổng chi tiêu phần cứng của DeepSeek trong suốt lịch sử công ty "cao hơn đáng kể" so với mức 500 triệu USD, gồm cả chi phí nghiên cứu và phát triển cũng như tổng chi phí sở hữu phần cứng. Khi CNBC liên hệ, DeepSeek chưa đưa ra bình luận ngay lập tức.
Các hồ sơ cho thấy DeepSeek là một trong những đơn vị có nguồn lực mạnh nhất Trung Quốc để đào tạo AI. Ngay từ năm 2019, Liang Wenfeng (nhà sáng lập DeepSeek) đã chi 200 triệu nhân dân tệ (27,8 triệu USD) để mua 1.100 GPU nhằm đào tạo các thuật toán giao dịch chứng khoán. High-Flyer (quỹ đầu cơ đứng sau DeepSeek)cho biết trung tâm điện toán của DeepSeek vào thời điểm đó có diện tích tương đương một sân bóng rổ, khoảng 436,6 mét vuông.
Năm 2021, High-Flyer đã chi 1 tỉ nhân dân tệ để phát triển cụm siêu máy tính Fire-Flyer 2, được kỳ vọng đạt công suất 1.550 petaflop, theo trang web của quỹ. Hiệu suất này tương đương với một số siêu máy tính mạnh nhất thế giới.
Petaflop là một đơn vị đo lường hiệu suất tính toán của siêu máy tính, viết tắt của Peta Floating Point Operations Per Second (nghìn nghìn tỉ phép toán dấu phẩy động mỗi giây).
Trong cuộc phỏng vấn với trang tin công nghệ 36Kr (Trung Quốc) vào tháng 5.2023, Liang Wenfeng cho biết High-Flyer đã mua gần 10.000 GPU Nvidia, gồm cả dòng A100 tiên tiến nhất vào thời điểm đó, trước khi Mỹ áp đặt hạn chế xuất khẩu loại chip này sang Trung Quốc.
Một số nhà phân tích xác định rằng việc High-Flyer chi tiêu mạnh vào phần cứng là yếu tố quan trọng giúp DeepSeek trở thành "ngựa ô" trong cuộc đua AI toàn cầu.
Theo SemiAnalysis, tổng chi tiêu vốn cho máy chủ của DeepSeek có thể đã lên đến 1,6 tỉ USD với khoảng 50.000 GPU Nvidia Hopper, gồm cả chi phí vận hành 944 triệu USD cho các cụm tính toán.
Báo cáo nhận định rằng chi phí nghiên cứu và phát triển của DeepSeek cùng với chi phí liên quan đến quyền sở hữu (vận hành, bản quyền hoặc sở hữu trí tuệ) là đáng kể. Ngoài ra, việc tạo dữ liệu tổng hợp để đào tạo mô hình sẽ cần "một lượng tính toán khổng lồ".
Một số giám đốc công nghệ tin rằng DeepSeek có thể đã đạt được hiệu suất cao nhờ đào tạo mô hình V3, R1 dựa trên các hệ thống AI lớn hơn của Mỹ. Kỹ thuật này được gọi là distillation (chưng cất tri thức).
Distillation trong AI là kỹ thuật học máy trong đó một mô hình nhỏ hơn, đơn giản hơn (gọi là student model – mô hình học sinh) được huấn luyện để bắt chước hiệu suất của mô hình lớn hơn, phức tạp hơn (gọi là teacher model – mô hình giáo viên).
Đây là tuyên bố mà chính OpenAI đã ám chỉ. Tháng trước, OpenAI nói với CNBC rằng đang xem xét các báo cáo cho rằng DeepSeek có thể đã "sử dụng không phù hợp" dữ liệu đầu ra từ các mô hình của họ để phát triển V3 và R1 bằng phương pháp distillation.
"Hầu hết những lo ngại của thị trường về DeepSeek thực sự bị thổi phồng. DeepSeek vẫn cần các mô hình AI lớn vì sử dụng phương pháp chưng cất từ chúng. Tôi nghĩ câu trả lời ngắn gọn mà mọi người nên ghi nhớ là cuộc chơi đã bắt đầu, nhưng các mô hình AI lớn vẫn thực sự quan trọng", Reid Hoffman nói với CNBC.
Demis Hassabis, người đứng đầu Google DeepMind được trao giải Nobel Hóa học 2024, đánh giá DeepSeek là AI tốt nhất Trung Quốc nhưng "không có tiến bộ gì mới".
"Tôi nghĩ đây có lẽ là sản phẩm tốt nhất tôi từng thấy từ Trung Quốc", Demis Hassabis nói với CNBC.
Giám đốc điều hành Google Deepmind nhận xét: "DeepSeek có thể thực hiện kỹ thuật cực kỳ tốt và là mô hình AI có thể thay đổi mọi thứ trên quy mô địa chính trị". Dù vậy, xét về góc độ công nghệ, ông cho rằng đây không phải là thay đổi lớn.
"Bất chấp sự cường điệu, không có tiến bộ khoa học mới thực sự nào ở đây cả. Thay vào đó, mô hình chỉ sử dụng các kỹ thuật đã biết trong AI. Sự cường điệu xung quanh DeepSeek đã bị phóng đại một chút", Demis Hassabis nói thêm.
Victor Riparbelli, Giám đốc điều hành nền tảng video AI Synthesia, nói với CNBC rằng dù DeepSeek thách thức "quan điểm rằng mở rộng quy mô là cách duy nhất để xây dựng các mô hình ngày càng tốt hơn", nhưng ý tưởng các công ty sẽ đột ngột từ bỏ OpenAI hay Anthropic để chuyển sang DeepSeek là sai lầm.
"Tôi vẫn nghĩ rằng khi xem xét những người dùng các công nghệ này và tất cả quy trình làm việc. Nếu chúng ta nhìn lại sau ba tháng nữa, tôi nghĩ chỉ có 0,01% trong số đó sẽ chuyển từ OpenAI và Anthropic sang DeepSeek", Victor Riparbelli nhận định.
Meredith Whitaker, Chủ tịch của Signal Foundation, cho rằng sự phát triển của DeepSeek không có tác động đáng kể đến ngành công nghiệp, vì động lực thị trường vẫn chủ yếu nghiêng về các mô hình AI lớn hơn. Signal Foundation là tổ chức phi lợi nhuận hỗ trợ ứng dụng nhắn tin mã hóa Signal.
Meredith Whitaker cho rằng DeepSeek chưa đủ sức làm thay đổi cục diện quyền lực trong ngành AI hay ảnh hưởng đến cán cân địa chính trị toàn cầu. Bà nhấn mạnh rằng, trong lịch sử, các cải tiến về hiệu suất không làm giảm sự thống trị của những công ty AI lớn, mà chính quy mô khổng lồ của họ mới là yếu tố quyết định quyền lực.