AI nguồn mở DeepSeek Trung Quốc vượt mặt các ông lớn AI Mỹ thế nào?

DeepSeek đã tạo ra một cơn địa chấn, không chỉ làm thay đổi cục diện của ngành công nghiệp AI mà còn mở ra cơ hội lớn hơn cho các doanh nghiệp khởi nghiệp trên toàn thế giới. Chúng ta có thể đang chứng kiến bước ngoặt lịch sử trong ngành trí tuệ nhân tạo.

Startup Trung Quốc vượt mặt ChatGPT với chi phí "rẻ bất ngờ"

Hôm qua (27/01/2025), lần đầu tiên trong lịch sử, một công ty startup 1 tuổi của Trung Quốc DeepSeek vừa ra mắt DeepSeek R1 vào tuần trước, mô hình AI mã nguồn mở đã khiến vốn hóa của ông lớn Nvidia bốc hơi 600 tỷ USD chỉ trong 1 ngày và khơi mào những tranh luận về nguy cơ bong bóng AI.

DeepSeek đang gây náo loạn toàn thế giới, trở thành một thế lực mới nổi trong lĩnh vực trí tuệ nhân tạo đến từ Trung Quốc hiện đang liên tục đứng vị trí đầu tiên, vượt qua OpenAI, trở thành ứng dụng miễn phí được tải xuống nhiều nhất tại Mỹ trên App Store. Cổ phiếu công nghệ toàn cầu đã sụt giảm mạnh, khiến vốn hóa thị trường bốc hơi hàng tỷ USD.

Cùng ngày, DeepSeek thông báo sẽ tạm thời hạn chế đăng ký người dùng mới “do các cuộc tấn công ác ý quy mô lớn” vào dịch vụ của mình, mặc dù người dùng hiện tại vẫn có thể đăng nhập bình thường.

DeepSeek: Từ quỹ đầu tư đến "ngôi sao" AI

DeepSeek được thành lập năm 2023 bởi Liang Wenfeng, đồng sáng lập High-Flyer – một quỹ đầu tư tập trung vào công nghệ AI. Ban đầu, DeepSeek chỉ là bộ phận nghiên cứu AI của quỹ và được High-Flyer tài trợ toàn phần.

Tiếng tăm của DeepSeek bắt đầu bùng nổ khi startup này ra mắt R1, một mô hình lập luận được cho là đối thủ ngang hàng với mô hình o1 của OpenAI. Đây là mã nguồn mở, nghĩa là bất kỳ nhà phát triển AI nào cũng có thể sử dụng, và nhanh chóng vươn lên đứng đầu các cửa hàng ứng dụng và bảng xếp hạng trong ngành, với nhiều lời khen ngợi về hiệu suất và khả năng lập luận của nó.

Công ty DeepSeek. Ảnh: Getty

Công ty DeepSeek. Ảnh: Getty

Yann LeCun, nhà khoa học AI hàng đầu của Meta, viết trên LinkedIn rằng thành công của DeepSeek là dấu hiệu cho thấy sự thay đổi trong ngành AI theo hướng ủng hộ công nghệ mã nguồn mở.

Theo LeCun, DeepSeek đã tận dụng một phần công nghệ của Meta, chẳng hạn như các mô hình Llama, và rằng startup này “đã đưa ra các ý tưởng mới và xây dựng dựa trên công việc của người khác. Vì công trình của họ được công bố và mã nguồn mở, tất cả mọi người đều có thể hưởng lợi từ đó. Đó là sức mạnh của nghiên cứu công khai và mã nguồn mở.”

1.000 tỷ USD bốc hơi vì cú sốc DeepSeek gây chấn động làng AI, Nvidia và loạt cổ phiếu Mỹ lao dốc không phanh.

Trước đây, quan điểm phổ biến cho rằng các công ty AI cần chip tiên tiến đắt đỏ của Nvidia để huấn luyện hệ thống tốt nhất. Tuy nhiên, DeepSeek đã chứng minh điều ngược lại khi sử dụng các chip kém hiện đại hơn kết hợp với kỹ thuật huấn luyện sáng tạo. Điều này đã biện minh cho khoản chi tiêu khổng lồ từ các công ty công nghệ lớn nhất của Mỹ như Alphabet và Meta Platforms.

Chỉ tuần trước, các công ty như SoftBank, Oracle và OpenAI đã cam kết chi 500 tỷ USD để xây dựng cơ sở hạ tầng AI mới trong một liên doanh có tên Stargate.

Tuy nhiên, DeepSeek không sử dụng các con chip tiên tiến nhất — và các mô hình của họ dường như đạt hiệu suất ngang ngửa với các đối thủ hàng đầu tại Mỹ trên một số chỉ số đánh giá năng lực AI. DeepSeek cho biết họ sử dụng các con chip kém tiên tiến hơn, kết hợp với các kỹ thuật huấn luyện mô hình sáng tạo.

Ngoài ra, DeepSeek đã phát hành mô hình R1 dưới dạng mã nguồn mở, cho phép các công ty khác sử dụng và điều chỉnh mô hình này cho mục đích riêng của họ. Điều này có thể dẫn đến sự xuất hiện của nhiều giải pháp AI giá rẻ khác.

DeepSeek hoạt động tốt như thế nào?

Các nhà nghiên cứu của DeepSeek cho biết họ đã thử nghiệm R1 với một số mô hình AI hàng đầu từ OpenAI và nhận thấy rằng mô hình của họ rất cạnh tranh. Các đánh giá bao gồm bài kiểm tra lập trình máy tính, yêu cầu mô hình AI phải tự hoàn thành các nhiệm vụ, chẳng hạn như sửa lỗi trong một đoạn mã phần mềm. R1 đạt hiệu suất ngang ngửa với phiên bản o1 của OpenAI và vượt qua phiên bản cũ hơn có tên o1-mini.
DeepSeek công bố chi phí sử dụng R1 thấp hơn rất nhiều so với các công ty Mỹ.

Người dùng trên nền tảng X (trước đây là Twitter) cho biết họ ấn tượng với kỹ năng viết và giải quyết vấn đề của R1, nhưng một số cho rằng mô hình này kém hơn đối thủ ở một số loại bài toán cụ thể. Trong vài tuần tới, các thử nghiệm độc lập có thể cung cấp cái nhìn rõ hơn về hiệu suất thực sự của R1.

Không phải ai cũng nghĩ rằng DeepSeek đã làm rung chuyển ngành công nghiệp AI. Trong khi DeepSeek có thể tìm cách cắt giảm chi phí đào tạo AI, nhu cầu AI vẫn đang tăng mạnh, và các công ty công nghệ vẫn cần nhiều năng lực tính toán hơn.

Nhà phân tích Stacy Rasgon của Bernstein viết: “DeepSeek có phải là ngày tận thế cho các dự án AI? Chúng tôi không nghĩ vậy.”

Tại sao Nvidia bị ảnh hưởng nặng nề?

Trong hai năm qua, khi thị trường đặt niềm tin rằng trí tuệ nhân tạo (AI) sẽ mở ra một kỷ nguyên tăng trưởng năng suất mới, hàng nghìn tỷ USD lợi nhuận đã được tạo ra trên thị trường chứng khoán. Nvidia, nhà sản xuất chip đứng ở trung tâm cuộc cách mạng AI, đã dẫn đầu trong làn sóng tăng trưởng này. Phố Wall coi Nvidia là một công ty gần như không thể bị đánh bại nhờ công nghệ chip tiên tiến của họ.

Việc phát hành R1 dưới dạng mã nguồn mở đã mở ra cơ hội cho nhiều công ty nhỏ phát triển AI giá rẻ, tạo nên sức ép cạnh tranh mạnh mẽ. Điều này dẫn đến giá trị vốn hóa của Nvidia – trụ cột của ngành AI – bị ảnh hưởng nghiêm trọng khi thị trường lo ngại về sự độc quyền của họ.

“Mô hình DeepSeek là một bước tiến vượt bậc trong AI và là ví dụ hoàn hảo về kỹ thuật tăng cường tại thời điểm thử nghiệm (test time scaling),” một phát ngôn viên của Nvidia chia sẻ với CNBC hôm 27/01/2025. “Công trình của DeepSeek minh họa cách các mô hình mới có thể được tạo ra bằng kỹ thuật đó, tận dụng các mô hình phổ biến sẵn có và hệ thống tính toán hoàn toàn tuân thủ các quy định xuất khẩu.”

Tuyên bố của Nvidia cho thấy hãng này nhìn nhận đột phá của DeepSeek như một cách thúc đẩy nhu cầu sử dụng nhiều hơn đối với các bộ xử lý đồ họa (GPU) của mình. “Quá trình suy diễn (inference) yêu cầu một lượng lớn GPU của Nvidia và mạng lưới hiệu suất cao,” phát ngôn viên nói thêm. “Chúng ta hiện có ba quy luật mở rộng: giai đoạn tiền huấn luyện, giai đoạn hậu huấn luyện, và giờ đây là kỹ thuật tăng cường tại thời điểm thử nghiệm (test-time scaling).”

Nvidia cũng cho biết các GPU mà DeepSeek sử dụng hoàn toàn tuân thủ quy định xuất khẩu. DeepSeek khẳng định họ sử dụng các phiên bản đặc biệt của GPU Nvidia được thiết kế riêng cho thị trường Trung Quốc.

Ai có thể hưởng lợi từ sự xáo trộn này?

Thành công của DeepSeek có thể tái cân bằng sân chơi AI toàn cầu, điều này khiến một số quốc gia ngoài Mỹ vui mừng.

Các quan chức chính phủ Pháp cho rằng DeepSeek cho thấy các công ty nhỏ gọn và sáng tạo vẫn có thể cạnh tranh trong cuộc đua AI, ngay cả khi họ có ít tiền hoặc hạn chế về khả năng tiếp cận các con chip tiên tiến nhất.

“Một thông điệp là chúng ta vẫn có thể cạnh tranh,” một quan chức tại Điện Élyseé nhận định, lưu ý rằng sức mạnh tính toán thô có thể không còn là yếu tố quyết định ai thắng trong cuộc đua AI.

DeepSeek đã tạo ra một cơn địa chấn, không chỉ làm thay đổi cục diện của ngành công nghiệp AI mà còn mở ra cơ hội lớn hơn cho các doanh nghiệp khởi nghiệp trên toàn thế giới. Chúng ta có thể đang chứng kiến bước ngoặt lịch sử trong ngành trí tuệ nhân tạo.

CTV Minh Trí/VOV.VN Theo CNBC và WSJ

Nguồn VOV: https://vov.vn/cong-nghe/ai-nguon-mo-deepseek-trung-quoc-vuot-mat-cac-ong-lon-ai-my-the-nao-post1151518.vov
Zalo