DeepSeek cam kết công khai mã mô hình AI, tăng gấp đôi nguồn mở

Công ty khởi nghiệp Trung Quốc, DeepSeek hôm nay (21/2) tuyên bố sẽ công khai mã các mô hình, cam kết tăng cường gấp đôi trí tuệ nhân tạo nguồn mở.

Viết trong một bài đăng trên nền tảng truyền thông xã hội X, DeepSeek cho biết sẽ mở nguồn 5 kho mã vào tuần tới, mô tả động thái này là "tiến bộ nhỏ nhưng chân thành" mà họ sẽ chia sẻ với sự minh bạch hoàn toàn. "Những khối xây dựng khiêm tốn này trong dịch vụ trực tuyến của chúng tôi đã được ghi lại, triển khai và thử nghiệm trong sản xuất", bài đăng cho biết.

DeepSeek cam kết công khai mã mô hình AI, tăng gấp đôi nguồn mở.

DeepSeek cam kết công khai mã mô hình AI, tăng gấp đôi nguồn mở.

DeepSeek đã làm rung chuyển ngành công nghiệp AI toàn cầu vào tháng trước khi phát hành mô hình suy luận R1 mã nguồn mở, cạnh tranh với các hệ thống phương Tây về hiệu suất trong khi được phát triển với chi phí thấp hơn nhiều.

Cam kết của công ty đối với nguồn mở đã phân biệt nó với hầu hết các doanh nghiệp AI ở Trung Quốc, những công ty giống như các đối thủ Mỹ của họ, nghiêng về các mô hình nguồn đóng. Người sáng lập DeepSeek, Liang Wenfeng đã nói trong cuộc trả lời phỏng vấn hiếm hoi với một cơ quan truyền thông Trung Quốc hồi năm ngoái không ưu tiên thương mại hóa các mô hình AI và có sức mạnh mềm thu được từ nguồn mở.

"Việc người khác theo dõi sự đổi mới của bạn mang lại cảm giác thành tựu lớn. Trên thực tế, nguồn mở mang tính văn hóa hơn là thương mại và nó giúp chúng tôi có được sự tôn trọng", Liang nói hồi tháng 7 năm ngoái.

Mã nguồn mở mới được phát hành sẽ cung cấp cơ sở hạ tầng để hỗ trợ các mô hình AI mà DeepSeek chia sẻ công khai, xây dựng dựa trên các khung mô hình nguồn mở hiện có đó.

Thông báo này được đưa ra sau khi DeepSeek phát hành một thuật toán mới có tên là Native Sparse Attention (NSA) vào hôm thứ ba, được thiết kế để làm cho việc đào tạo và suy luận theo ngữ cảnh dài hiệu quả hơn.

Cơ sở người dùng của DeepSeek đã bùng nổ kể từ tháng trước. Theo Aicpb.com, một trang web Trung Quốc theo dõi các sản phẩm AI, sản phẩm của DeepSeek là dịch vụ chatbot phổ biến nhất tại quốc gia châu Á này với 22,2 triệu người dùng hoạt động hàng ngày tính đến ngày 11/1, vượt qua 16,95 triệu người dùng của Douban.

"Trong một cuộc họp hồi đầu tuần, Chủ tịch Trung Quốc Tập Cận Bình đã nồng nhiệt chào đón nhà sáng lập DeepSeek, Liang Wenfeng và trao một vị trí đáng mơ ước để chuyên gia trẻ tuổi này ngồi bên cạnh lãnh đạo của các doanh nghiệp tư nhân lớn nhất nước này. Điều đó cho thấy Bắc Kinh rất muốn hỗ trợ công ty", nhà sáng lập kiêm chủ tịch của Trung tâm Trung Quốc và Toàn cầu hóa, Huiyao Wang cho biết.

"DeepSeek đại diện cho những gì Bắc Kinh mong muốn, bằng "lực lượng sản xuất chất lượng mới sẽ thúc đẩy Trung Quốc tiến lên", ông Wang nói thêm, ám chỉ đến một chiến lược do Chủ tịch Tập Cận Bình đưa ra vào năm ngoái, đặt cược vào những đột phá về công nghệ để thúc đẩy tăng trưởng và tăng năng suất trên toàn nền kinh tế.

Ngân hàng Goldman Sachs ước tính GDP của Trung Quốc sẽ tăng từ 20 điểm cơ bản đến 30 điểm cơ bản trong dài hạn - vào năm 2030 - thì họ kỳ vọng nền kinh tế của nước này sẽ bắt đầu phản ánh tác động tích cực của việc áp dụng AI ngay từ năm sau khi tự động hóa do AI thúc đẩy cải thiện năng suất.

Đức Bình

Nguồn Giao Thông: https://www.baogiaothong.vn/deepseek-cam-ket-cong-khai-ma-mo-hinh-ai-tang-gap-doi-nguon-mo-192250221180736854.htm
Zalo