Ai đứng sau DeepSeek, 'kỳ lân' AI mới của Trung Quốc đang gây chấn động giới công nghệ?

DeepSeek, một công ty trí tuệ nhân tạo (AI) non trẻ của Trung Quốc, đã nhanh chóng trở thành tâm điểm toàn cầu khi chỉ trong một thời gian ngắn, ứng dụng của họ vươn lên dẫn đầu các bảng xếp hạng, vượt qua cả OpenAI và Anthropic. Thành công này không chỉ giúp công ty đạt mức định giá ít nhất 1 tỷ USD mà còn đưa nhà sáng lập Liang Wenfeng vào hàng ngũ những doanh nhân giàu có nhất thế giới.

DeepSeek đã tác động mạnh đến ngành công nghiệp chip AI

Việc công ty Trung Quốc này tung ra những mô hình AI mã nguồn mở mạnh mẽ với chi phí đào tạo thấp đã khiến giá trị thị trường của các gã khổng lồ AI Mỹ sụt giảm hàng trăm tỷ USD, nhưng lại mang đến niềm hy vọng cho những công ty khởi nghiệp muốn cạnh tranh với Nvidia.

Thông thường, khi một sự kiện làm lung lay thị trường chip AI, các công ty khởi nghiệp sẽ rơi vào tình thế lo ngại. Nhưng với DeepSeek, tình hình lại hoàn toàn khác. Andrew Feldman, CEO của Cerebras – một startup chip AI trị giá 4 tỷ USD – không giấu nổi sự hào hứng: "Chúng tôi không thể bắt kịp các cuộc gọi từ khách hàng. Đây là những ngày tuyệt vời!"

Nguyên nhân chính là DeepSeek đã thay đổi quan niệm cố hữu trong ngành: AI không nhất thiết phải chạy trên các hệ thống đắt đỏ với hàng trăm ngàn chip Nvidia. Thay vào đó, nếu tối ưu hóa quá trình suy luận (inference) – tức là giai đoạn AI vận hành thay vì huấn luyện – thì AI có thể hoạt động hiệu quả hơn với chi phí thấp hơn. Đây chính là mảng mà các công ty như Cerebras, SambaNova (5,1 tỷ USD) và Groq (2,8 tỷ USD) đang tập trung phát triển.

Rodrigo Liang, CEO của SambaNova, cho rằng DeepSeek đã "lật ngược cuộc chơi" cho ngành inference AI. Trong khi đó, Groq ghi nhận số lượng đăng ký sử dụng chip tăng vọt sau khi tích hợp mô hình R1 của DeepSeek vào nền tảng GroqCloud.

Một trong những tuyên bố gây sốc nhất của DeepSeek là họ đã huấn luyện mô hình V3 – một mô hình AI với 671 tỷ tham số – chỉ với 5,58 triệu USD trong hai tháng, thấp hơn rất nhiều so với con số 100 triệu USD mà OpenAI chi cho GPT-4. Tuy nhiên, giới công nghệ vẫn tranh cãi về độ chính xác của con số này.

Một số chuyên gia tin rằng DeepSeek có thể đã sử dụng nhiều tài nguyên hơn mức họ công bố. Alexandr Wang, CEO của Scale, cho rằng DeepSeek có thể sở hữu khoảng 50.000 GPU Nvidia H100 – loại chip bị cấm xuất khẩu sang Trung Quốc. Tuy nhiên, dù chi phí thực sự là 6 triệu hay 60 triệu USD, điểm quan trọng là nó vẫn thấp hơn nhiều so với con số 600 triệu USD mà các đối thủ thường chi cho quá trình huấn luyện AI.

DeepSeek có thể thúc đẩy sự đổi mới trong ngành AI?

DeepSeek không chỉ chứng minh rằng AI có thể được đào tạo với chi phí thấp hơn, mà còn nhấn mạnh tầm quan trọng của inference trong quá trình vận hành mô hình AI. Những mô hình như R1 của DeepSeek – miễn phí sử dụng thay vì tính phí 200 USD/tháng như OpenAI – đòi hỏi nhiều năng lực xử lý inference hơn, mở ra cơ hội cho các startup chip AI.

Trái lại, Nvidia đang chịu áp lực lớn. Ngày 19/1, cổ phiếu của Nvidia giảm 17%, khiến giá trị thị trường mất gần 600 tỷ USD. Theo Rodrigo Liang, CEO của SambaNova, điều này phản ánh thực tế rằng phần lớn doanh thu của Nvidia vẫn đến từ các công ty mua GPU để huấn luyện AI, chứ không phải để vận hành chúng.

Dù vậy, CEO Jensen Huang của Nvidia vẫn là một đối thủ đáng gờm. Công ty đã nhanh chóng nhấn mạnh khả năng inference của chip Nvidia và tuyên bố rằng AI vẫn sẽ cần một số lượng lớn GPU mạnh mẽ.

DeepSeek không chỉ tạo ra tác động tài chính mà còn mang đến những thay đổi về mặt công nghệ. Các startup AI giờ đây đang tìm cách tận dụng những bài học từ DeepSeek để tối ưu hóa chi phí và hiệu suất. Evan Conrad, đồng sáng lập công ty San Francisco Compute, cho rằng nếu quá trình huấn luyện AI trở nên hiệu quả hơn, các công ty có thể tạo ra những mô hình mạnh mẽ hơn mà không cần gia tăng tài nguyên đáng kể.

Ngoài ra, sự kiện này còn có ý nghĩa lớn đối với những công ty khởi nghiệp trong ngành chip AI. Như Andrew Feldman của Cerebras nói: "Những ai đang là kẻ yếu thế trong ngành này sẽ cảm thấy được tiếp thêm động lực."

Thu Trang (Theo Forbes)

Nguồn Người Đưa Tin: https://nguoiduatin.vn/huan-luyen-ai-voi-chi-phi-thap-ky-luc-so-voi-openai-chi-cho-gpt-4-deepseek-tao-nen-su-bung-no-moi-204250302175108411.htm
Zalo