Alibaba ra mắt mô hình AI Qwen 2.5, tuyên bố vượt trội hơn DeepSeek
Công ty công nghệ Trung Quốc Alibaba vừa công bố phiên bản mới của mô hình trí tuệ nhân tạo (AI) Qwen 2.5, khẳng định vượt trội hơn DeepSeek-V3, một trong những mô hình AI đang được đánh giá cao.
Điều đáng chú ý là Alibaba đã phát hành Qwen 2.5-Max vào ngày đầu tiên của Tết Nguyên đán - một thời điểm không thường thấy đối với những công bố lớn, khi phần lớn người dân Trung Quốc nghỉ ngơi bên gia đình.
Động thái này cho thấy sự cạnh tranh khốc liệt mà công ty khởi nghiệp AI DeepSeek đang tạo ra không chỉ đối với các đối thủ quốc tế mà còn cả những tập đoàn công nghệ lớn trong nước.
Theo thông báo trên tài khoản WeChat chính thức, đơn vị điện toán đám mây của Alibaba khẳng định rằng: "Qwen 2.5-Max vượt trội hơn hầu hết các mô hình GPT-4o, DeepSeek-V3 và Llama-3.1-405B". Đây là những mô hình AI mã nguồn mở tiên tiến nhất đến từ OpenAI và Meta.
DeepSeek gây chấn động thị trường công nghệ
Sự ra mắt của trợ lý AI DeepSeek vào ngày 10/1 với mô hình DeepSeek-V3, cùng với mô hình R1 vào ngày 20/1, đã khiến ngành công nghệ xôn xao. Chi phí phát triển và sử dụng thấp của DeepSeek đã làm dấy lên lo ngại trong giới đầu tư về chiến lược chi tiêu khổng lồ của các công ty AI hàng đầu tại Mỹ.
Không chỉ ảnh hưởng đến thị trường quốc tế, sự thành công của DeepSeek còn châm ngòi cho một cuộc chạy đua trong nước. Chỉ 2 ngày sau khi DeepSeek-R1 ra mắt, ByteDance - công ty mẹ của TikTok - đã tung ra bản cập nhật cho mô hình AI hàng đầu của mình. Mô hình này được cho là vượt trội hơn so với OpenAI o1 trên bài kiểm tra AIME, vốn đánh giá khả năng hiểu và phản hồi của AI đối với các hướng dẫn phức tạp.
DeepSeek cũng tuyên bố rằng mô hình R1 của họ có thể sánh ngang với OpenAI o1 trên nhiều tiêu chí hiệu suất.
DeepSeek và cuộc chiến giá cả trong ngành AI
Mô hình DeepSeek-V2, tiền thân của DeepSeek-V3, đã gây ra một cuộc chiến giá cả tại Trung Quốc khi ra mắt vào tháng 5/2024. Việc DeepSeek-V2 là mã nguồn mở và có giá cực rẻ - chỉ 1 nhân dân tệ (0,14 USD) cho mỗi triệu token - đã buộc Alibaba phải cắt giảm giá tới 97% cho một loạt mô hình AI của họ.
Những gã khổng lồ công nghệ khác của Trung Quốc như Baidu và Tencent cũng nhanh chóng tham gia vào cuộc đua AI. Baidu đã ra mắt mô hình tương đương với ChatGPT vào tháng 3/2023, trong khi Tencent - công ty internet có giá trị nhất Trung Quốc - cũng đang đầu tư mạnh vào AI.
Tầm nhìn của DeepSeek: Không quan tâm đến cuộc chiến giá cả
Liang Wenfeng, nhà sáng lập bí ẩn của DeepSeek, đã có một cuộc phỏng vấn hiếm hoi với truyền thông Trung Quốc hồi tháng 7/2024. Ông khẳng định DeepSeek không quan tâm đến cuộc chiến giá cả, mà mục tiêu chính của họ là đạt được AGI (trí tuệ nhân tạo tổng quát) - một hệ thống AI có thể vượt trội hơn con người trong hầu hết các nhiệm vụ kinh tế.
Trong khi các tập đoàn lớn như Alibaba có hàng trăm nghìn nhân viên, DeepSeek hoạt động như một phòng thí nghiệm nghiên cứu, chủ yếu gồm sinh viên mới tốt nghiệp và nghiên cứu sinh tiến sĩ từ các trường đại học hàng đầu Trung Quốc.
Liang cho rằng các công ty công nghệ lớn có thể không phù hợp với tương lai của ngành AI do chi phí cao và cơ cấu tổ chức cứng nhắc, trong khi DeepSeek duy trì mô hình tinh gọn và linh hoạt hơn.
"Các mô hình AI lớn đòi hỏi sự đổi mới liên tục, nhưng những gã khổng lồ công nghệ lại bị giới hạn bởi hệ thống quản lý cồng kềnh của họ", Liang nhận định.