Trung Quốc đã vượt Mỹ trong một số mô hình AI
Các chuyên gia AI đánh giá một số mô hình AI của Trung Quốc đang bắt kịp, thậm chí vượt qua đối thủ Mỹ, về hiệu suất.
Chia sẻ với CNBC, các chuyên gia cho rằng nỗ lực thống trị thế giới AI của Trung Quốc có thể đang được đền đáp. Những mô hình AI của đại lục đặc biệt phổ biến, đang bắt kịp – thậm chí vượt qua đối thủ Mỹ về hiệu suất.
AI đã trở thành mặt trận mới trong thương chiến Mỹ - Trung. Cả hai bên đều xem đây là công nghệ chiến lược. Washington tiếp tục hạn chế quyền truy cập chip tối tân của Bắc Kinh do lo ngại ảnh hưởng đến an ninh quốc gia. Nó dẫn đến việc Trung Quốc theo đuổi cách tiếp cận riêng để thúc đẩy các mô hình AI của riêng mình, bao gồm phụ thuộc vào công nghệ nguồn mở và phát triển phần mềm, chip “cây nhà lá vườn”.
Tương tự các doanh nghiệp Mỹ dẫn đầu trên thị trường, các công ty AI Trung Quốc cũng phát triển mô hình ngôn ngữ lớn (LLM), được huấn luyện dựa trên lượng lớn dữ liệu và là nền tảng của các ứng dụng như chatbot.
Dù vậy, khác với các mô hình của OpenAI, doanh nghiệp đại lục phát triển LLM nguồn mở, trong đó, nhà phát triển có thể tải về và viết ứng dụng miễn phí mà không cần sự cho phép từ tác giả.
Trên kho lưu trữ LLM Hugging Face, các mô hình ngôn ngữ lớn Trung Quốc được tải về nhiều nhất. Theo kỹ sư máy học Tiezhen Wang của Hugging Face, Qwen – hệ thống mô hình AI của Alibaba – là phổ biến nhất. Ông cho biết Qwen ngày càng được ưa chuộng nhờ hiệu suất nổi bật.
Qwen tồn tại dưới nhiều kích cỡ - hay tham số - khác nhau. Các mô hình tham số lớn sẽ mạnh hơn nhưng đi cùng chi phí điện toán cao hơn, còn loại nhỏ hơn thì rẻ hơn. Dù thế nào, nó vẫn là một trong những mô hình tốt nhất hiện nay, theo Wang.
Startup DeepSeek cũng đang nổi lên với mô hình DeepSeek-R1. Nó cạnh tranh với mô hình o1 của OpenAI.
Các công ty này tuyên bố mô hình của họ có thể đối đầu với các giải pháp nguồn mở khác như Llama của Meta, cũng như LLM nguồn đóng như của OpenAI trên một số chức năng khác nhau.
Grace Isford, quản lý tại công ty đầu tư Lux Capital, nhận xét trong năm qua, họ đã chứng kiến sự trỗi dậy của các mô hình nguồn mở Trung Quốc đối với AI.
Trong bối cảnh địa chính trị phức tạp như hiện nay, LLM nguồn mở có một tác dụng khác với doanh nghiệp Trung Quốc: đó là chúng có thể sử dụng trên khắp thế giới, không chỉ trong biên giới đất nước. Nó giúp họ trở thành những người chơi toàn cầu trong lĩnh vực AI.
Các mô hình AI ngày nay được so sánh với các hệ điều hành như Windows, Android và iOS, với tiềm năng thống trị một thị trường. Xin Sun, giảng viên cao cấp về doanh nghiệp Trung Quốc và Đông Á tại trường King’s College London, nhận xét doanh nghiệp Trung Quốc xem LLM như trung tâm trong hệ sinh thái công nghệ tương lai.
Các mô hình kinh doanh của họ sẽ dựa vào việc nhà phát triển tham gia vào hệ sinh thái, phát triển ứng dụng mới dựa trên LLM của họ, thu hút người dùng và dữ liệu để từ đó phát sinh lợi nhuận qua các công cụ khác nhau.
Dù vậy, bị hạn chế tiếp cận chip tiên tiến phủ “mây đen” lên triển vọng AI của Trung Quốc. Các mô hình AI cần đến sức mạnh tính toán lớn.
Hiện tại, Nvidia là nhà cung ứng chip AI lớn nhất thế giới. Hầu hết công ty AI hàng đầu đều đào tạo hệ thống dựa trên chip tối tân của Nvidia, nhưng Trung Quốc thì không.
Trong năm vừa qua, Mỹ tăng cường kiểm soát xuất khẩu bán dẫn và thiết bị sản xuất bán dẫn hiện đại sang Trung Quốc. Nó đồng nghĩa chip mạnh nhất của Nvidia không thể được bán sang đại lục.
Song, các nền tảng công nghệ Trung Quốc lớn đã tích trữ số lượng lớn GPU Nvidia và đang tận dụng GPU nội từ Huawei... để không ngừng cải tiến mô hình.
Thực tế, doanh nghiệp Trung Quốc không ngừng nỗ lực tìm cách thay thế Nvidia mà Huawei là một trong những lá cờ đầu. Baidu và Alibaba cũng đang đầu tư vào thiết kế bán dẫn.
Theo Isford, Trung Quốc đang đầu tư và phát triển toàn bộ hạ tầng AI nội địa một cách hệ thống mà không xoay quanh Nvidia. Do vậy, dù chip Nvidia có bị cấm bán sang đại lục hay không, cũng không thể ngăn cản Bắc Kinh đầu tư và xây dựng hạ tầng riêng để phát triển và đào tạo mô hình AI.
(Theo CNBC, SCMP)