DeepSeek: Tỷ lệ chi phí - lợi nhuận lý thuyết liên quan mô hình V3 và R1 là 545% mỗi ngày
DeepSeek hôm 1.3 đã công bố một số dữ liệu về chi phí và doanh thu liên quan đến mô hình trí tuệ nhân tạo nguồn mở V3 và R1 nổi tiếng của họ, khẳng định tỷ lệ chi phí - lợi nhuận lý thuyết có thể lên tới 545% mỗi ngày. Tuy nhiên, công ty khởi nghiệp Trung Quốc này lưu ý rằng doanh thu thực tế sẽ thấp hơn đáng kể.
Đây là lần đầu tiên DeepSeek, công ty có trụ sở tại thành phố Hàng Châu, tiết lộ thông tin về biên lợi nhuận từ các tác vụ suy luận ít tốn tài nguyên tính toán hơn. Suy luận là giai đoạn mô hình AI (sau khi được trải qua quá trình đào tạo) thực hiện dự đoán hoặc nhiệm vụ, chẳng hạn qua chatbot.
Thông tin này có thể khiến các cổ phiếu AI bên ngoài Trung Quốc tiếp tục chao đảo, sau đợt lao dốc cuối tháng 1 khi mô hình R1 và V3 của DeepSeek bất ngờ gây sốt toàn cầu. Đợt bán tháo cổ phiếu xuất phát từ tuyên bố của DeepSeek rằng chi phí đào tạo V3 chưa đến 6 triệu USD, thấp hơn nhiều so với các công ty Mỹ như OpenAI, Google, Anthropic.
Nvidia H800, loại chip mà DeepSeek sử dụng để đào tạo V3, cũng kém mạnh mẽ hơn nhiều so với những gì OpenAI và các công ty Mỹ khác có, khiến giới đầu tư càng nghi ngờ về cam kết chi hàng tỉ USD cho chip Nvidia tiên tiến.
Trong bài đăng trên nền tảng mã nguồn mở GitHub hôm 1.3, DeepSeek cho biết: “Nếu giả định chi phí thuê một chip H800 là 2 USD/giờ, tổng chi phí suy luận hằng ngày cho mô hình V3 và R1 là 87.072 USD. Trong khi đó, doanh thu lý thuyết từ hai mô hình này là 562.027 USD/ngày, dẫn đến tỷ lệ chi phí-lợi nhuận 545%. Tính theo năm, doanh thu sẽ đạt hơn 200 triệu USD”.
Tuy nhiên, DeepSeek nhấn mạnh doanh thu thực tế thấp hơn nhiều do phí sử dụng mô hình V3 thấp hơn R1, chỉ một số dịch vụ kiếm được tiền trong khi truy cập web và ứng dụng vẫn miễn phí. Hơn nữa, nhà phát triển trả ít hơn vào giờ thấp điểm.

DeepSeek tiết lộ tỷ lệ chi phí-lợi nhuận lý thuyết liên quan mô hình V3 và R1 là 545% mỗi ngày, song doanh thu thực tế thấp hơn nhiều - Ảnh: Internet
Hôm 26.2, DeepSeek đã giới thiệu mức giá giảm sâu cho các nhà phát triển muốn sử dụng mô hình AI của hãng để xây dựng sản phẩm riêng. Động thái này có thể gây áp lực lên các đối thủ ở Trung Quốc và quốc tế trong việc cắt giảm giá.
DeepSeek cho biết trong khung giờ từ 16:30 GMT đến 00:30 GMT, chi phí sử dụng API (nền tảng cho phép các nhà phát triển tích hợp mô hình AI của DeepSeek vào ứng dụng và sản phẩm web) sẽ giảm tới 75%, đồng thời mở lại nạp tiền cho dịch vụ này sau hơn 2 tuần tạm dừng do quá tải nhu cầu.
Theo bảng giá trên trang web của DeepSeek, chi phí sử dụng API củamô hình R1 và V3 trong khung giờ này sẽ giảm lần lượt 75% và 50%.
Dù DeepSeek gọi khung giờ này là "ngoài giờ cao điểm" vì kéo dài từ 0 giờ 30 đến 8 giờ 30 theo giờ Bắc Kinh, nhưng thực tế lại rơi vào ban ngày tại châu Âu và Mỹ.
Việc giảm giá hôm 26.2 là động thái mới nhất trong chuỗi hành động của DeepSeek khiến ngành công nghiệp AI tại Trung Quốc và toàn cầu bị xáo trộn.
Ngoài thông tin về biên lợi nhuận, DeepSeek vừa tiết lộ các chi tiết kỹ thuật về quá trình phát triển mô hình suy luận R1 có hiệu suất ngang bằng o1 của OpenAI, với chi phí chỉ bằng một phần nhỏ so với thông thường. Đây là động thái được cho là sẽ thúc đẩy những tiến bộ toàn cầu trong lĩnh vực này.
Vài ngày qua, DeepSeek đã công bố 8 dự án nguồn mở trên GitHub. Đây là lần đầu tiên DeepSeek tiết lộ chi tiết về cách họ khai thác hiệu suất tốt nhất từ các chip trong tính toán, truyền thông và lưu trữ, vốn là những yếu tố then chốt của đào tạo mô hình AI.
Nhóm các nhà khoa học trẻ của DeepSeek cho biết đã tiết lộ "các khối xây dựng được thử nghiệm trong thực tế để chia sẻ tiến bộ tuy nhỏ nhưng chân thành với sự minh bạch tuyệt đối".
DeepSeek được các nhà phát triển toàn cầu hoan nghênh, ca ngợi vì tiết lộ các kỹ thuật mà họ sử dụng để xây dựng các mô hình AI hiệu suất cao, chi phí thấp của mình. Một số nhà phát triển, gồm cả người sáng lập nền tảng phát triển AI Hyperbolic, gọi DeepSeek mới là "OpenAI thực sự".
Dù có tên gọi như vậy nhưng OpenAI đã chuyển sang phương pháp tiếp cận nguồn đóng, giữ kín các phương pháp đào tạo cụ thể và chi phí tính toán của các mô hình AI. Sam Altman, người đồng sáng lập kiêm Giám đốc điều hành OpenAI, nói đầu tháng 2 rằng công ty "đã đi ngược lại lịch sử" và "cần tìm ra một chiến lược nguồn mở khác".
OpenAI, công ty khởi nghiệp được Microsoft hậu thuẫn, đã ra mắt GPT-4.5 hôm 27.2. Đây là mô hình AI mới nhất trong họ GPT-4, được giới thiệu cách đây gần hai năm.
GPT-4.5 được OpenAI mô tả là "mô hình trò chuyện lớn nhất và tốt nhất", nhưng đi kèm mức giá 150 USD cho mỗi triệu token đầu ra, cao gấp 270 lần mức 55 cent Mỹ mà DeepSeek áp dụng cho mô hình V3 và R1 vào giờ thấp điểm.
Token đầu ra là đơn vị đo lường dữ liệu được tạo ra bởi mô hình AI trong quá trình xử lý ngôn ngữ. Cụ thể:
Token là gì?
Token có thể là một từ, một phần của từ, một ký tự hoặc một chuỗi ký tự, tùy thuộc vào phương pháp token hóa mà mô hình sử dụng.
Ví dụ: Câu "Tôi thích AI" có thể được chia thành các token: ["Tôi", "thích", "AI"].
Token đầu ra
Là số lượng token mà mô hình AI sinh ra khi trả lời một yêu cầu.
Ví dụ: Nếu bạn hỏi ChatGPT "Giải thích về AI", câu trả lời "AI là trí tuệ nhân tạo..." sẽ được tính bằng số token đầu ra.
Tại sao tính phí theo token?
Mỗi token đầu ra đòi hỏi tài nguyên tính toán (CPU/GPU) để xử lý.
Các công ty như OpenAI hay DeepSeek tính phí dựa trên lượng token sinh ra để đo lường mức độ sử dụng dịch vụ.
Một số nhà phát triển AI đã sử dụng các kỹ thuật nguồn mở của DeepSeek. Các nhà nghiên cứu từ vLLM, dự án AI nguồn mở có nguồn gốc từ Đại học California - Berkeley (Mỹ), cho biết đã đạt được mức tăng hiệu suất tới 16% khi tích hợp một trong các phương pháp của DeepSeek.
Dù vậy, DeepSeek phải đối mặt với rất nhiều đối thủ cạnh tranh toàn cầu đang gấp rút tung ra các mô hình AI mới.
Anthropic, được Amazon hậu thuẫn, đã giới thiệu Claude 3.7 Sonnet hôm 25.2 với khả năng lập luận vượt trội trong toán và lập trình. Ngày 27.2, Tencent đã công bố Turbo S, mô hình AI được thiết kế để đưa ra phản hồi nhanh hơn DeepSeek R1 hoặc o1 của OpenAI.
Tuần này, Reuters đưa tin DeepSeek đang đẩy nhanh quá trình ra mắt R2 - phiên bản nâng cấp của R1.
Công ty có trụ sở tại Hàng Châu ban đầu dự định phát hành R2 vào đầu tháng 5, nhưng giờ đây muốn tung ra sớm nhất có thể, hai trong số các nguồn tin của Reuters cho biết.
DeepSeek hy vọng R2 sẽ cải thiện khả năng lập trình và có thể suy luận bằng nhiều ngôn ngữ ngoài tiếng Anh.
"Sự ra mắt của mô hình R2 của DeepSeek có thể trở thành cột mốc quan trọng trong ngành AI", Vijayasimha Alilughatta, Giám đốc điều hành nhà cung cấp dịch vụ công nghệ Zensar (Ấn Độ), nhận định. Thành công của DeepSeek trong việc tạo ra các mô hình AI tiết kiệm chi phí "có thể sẽ thúc đẩy các công ty trên toàn thế giới đẩy nhanh nỗ lực phá vỡ sự thống trị của một số ít công ty lớn trong lĩnh vực này", ông nói.
R2 có khả năng làm dấy lên mối lo ngại với chính phủ Mỹ, khi nước này coi AI là ưu tiên quốc gia. Việc phát hành R2 có thể càng khiến chính quyền và doanh nghiệp Trung Quốc phấn khích, với hàng chục công ty tuyên bố bắt đầu tích hợp các mô hình AI DeepSeek vào sản phẩm của mình.
Trước đó, DeepSeek đã mất 7 tháng để chuyển từ mô hình ngôn ngữ lớn V2 (phát hành vào tháng 5.2024) sang phiên bản V3 được cập nhật trong tháng 12.2024. R1, mô hình lập luận dựa trên V3, được DeepSeek phát hành vào tháng 1.2025.
Theo các nguồn tin và báo cáo phương tiện truyền thông, DeepSeek không vội vàng huy động thêm vốn hoặc tham gia vào các hoạt động thương mại mới, thay vào đó tập trung vào việc đạt được trí tuệ nhân tạo tổng quát (AGI).
AGI là dạng AI có khả năng hiểu, học hỏi và thực hiện các nhiệm vụ đa dạng một cách linh hoạt, giống hay vượt trội con người. Không giống AI hẹp, vốn chỉ giỏi trong một lĩnh vực cụ thể (như nhận dạng giọng nói hoặc hình ảnh), AGI có khả năng áp dụng kiến thức và kỹ năng trong nhiều lĩnh vực khác nhau, từ đó giải quyết các vấn đề phức tạp một cách tự chủ và sáng tạo. OpenAI định nghĩa AGI là "một hệ thống có tính tự chủ cao, vượt trội hơn con người ở hầu hết công việc có giá trị kinh tế".
Trong hai cuộc phỏng vấn với ấn phẩm tin tức công nghệ 36Kr, Lương Văn Phong (nhà sáng lập DeepSeek) cho biết mục tiêu cuối cùng của họ là đạt được AGI, sứ mệnh mà công ty dường như đặt lên trên lợi ích kinh doanh với trọng tâm là cung cấp công nghệ nguồn mở.
"Đích đến của chúng tôi là AGI. Mô hình ngôn ngữ lớn có thể là một con đường cần thiết dẫn đến AGI", Lương Văn Phong nói.
Khi được hỏi về thời điểm có thể đạt được AGI, Lương Văn Phong nói rằng "có thể mất 2 năm, 5 năm hoặc thậm chí 10 năm, nhưng cuối cùng thì sẽ đạt được nó trong thời đại của chúng ta".