Mô hình AI mới của công ty Trung Quốc vượt trội sản phẩm của Meta, OpenAI
VietTimes - DeepSeek cho biết mô hình DeepSeek V3, với 671 tỷ tham số, được phát triển chỉ trong hai tháng với chi phí 5,5 triệu USD.
Công ty khởi nghiệp Trung Quốc DeepSeek đã gây bất ngờ cho ngành trí tuệ nhân tạo (AI) toàn cầu khi phát hành mô hình ngôn ngữ lớn (LLM) mới có hiệu suất vượt trội so với các đối thủ như Meta Platforms và OpenAI - công ty đứng sau ChatGPT.
Trong bài đăng trên WeChat mới đây, DeepSeek cho biết mô hình DeepSeek V3, với 671 tỷ tham số, được phát triển chỉ trong hai tháng với chi phí 5,5 triệu USD. Mô hình này sử dụng ít tài nguyên điện toán hơn đáng kể so với các mô hình tương tự từ các tập đoàn công nghệ lớn.
LLM đóng vai trò nền tảng cho các dịch vụ AI tạo sinh như ChatGPT, với số lượng tham số lớn giúp mô hình xử lý dữ liệu phức tạp và đưa ra dự đoán chính xác. Việc DeepSeek đạt được thành tựu này với chi phí thấp đã thu hút sự chú ý của giới chuyên gia, bất chấp những hạn chế về công nghệ do các lệnh trừng phạt của Mỹ.
Nhà khoa học máy tính Andrej Karpathy, thành viên sáng lập nhóm tại OpenAI, đã nhận xét trên nền tảng mạng xã hội X: “DeepSeek khiến mọi thứ trông dễ dàng… với bản phát hành mở của một LLM tiên tiến được đào tạo với ngân sách không tưởng”.
Việc DeepSeek phát triển một LLM mạnh mẽ với chi phí thấp cho thấy khả năng cạnh tranh ngày càng cao của các công ty AI Trung Quốc, ngay cả khi đối mặt với các lệnh trừng phạt làm hạn chế quyền truy cập vào chất bán dẫn tiên tiến. Điều này không chỉ khẳng định vị thế của Trung Quốc trong lĩnh vực AI mà còn đặt ra thách thức lớn cho các đối thủ quốc tế.
Sự xuất hiện của DeepSeek V3 là minh chứng rõ ràng cho năng lực sáng tạo và hiệu quả của các công ty khởi nghiệp Trung Quốc trong việc thúc đẩy đổi mới công nghệ.