WAIC 2025: Trung Quốc tăng tốc với 1.509 mô hình AI, chiếm hơn 40% toàn cầu

Con số đó cho thấy bước nhảy vọt lớn của Trung Quốc trong lĩnh vực trí tuệ nhân tạo (AI) đang phát triển nhanh chóng.

Trung Quốc hiện có 1.509 mô hình AI, chiếm hơn 40% toàn cầu, theo dữ liệu từ Hội nghị Trí tuệ Nhân tạo Thế giới (WAIC) năm nay. Trên thế giới hiện có tổng cộng 3.755 mô hình AI, dẫn nguồn từ dữ liệu tại WAIC 2025, hãng thông tấn Tân Hoa Xã đưa tin hôm 28.7.

WAIC là hội nghị AI lớn và quan trọng nhất Trung Quốc, tập trung vào các tiến bộ, ứng dụng và xu hướng trong lĩnh vực AI. WAIC thường thu hút sự tham gia của các hãng công nghệ hàng đầu, nhà khoa học, nhà phát triển và người hoạch định chính sách từ khắp nơi trên thế giới để chia sẻ ý tưởng, giới thiệu sản phẩm mới và thảo luận về tương lai của AI.

Hội nghị này đóng vai trò quan trọng trong việc thúc đẩy sự phát triển của ngành AI, đặc biệt là ở Trung Quốc, nơi các tập đoàn công nghệ lớn đang đẩy mạnh đầu tư và cạnh tranh trong lĩnh vực này.

WAIC được tổ chức hằng năm để phô diễn công nghệ tiên tiến nhất của Trung Quốc, từng có Elon Musk và Jack Ma góp mặt.

Lượng người tham dự WAIC 2025 (từ 26 đến 28.7) có thể lập kỷ lục vì sự kiện diễn ra đúng lúc cuộc cạnh tranh công nghệ Mỹ - Trung đang nóng bỏng.

Số khách tham quan WAIC 2025 được kỳ vọng sẽ vượt mức 300.000 người ở WAIC 2024 - Ảnh: AFP

Số khách tham quan WAIC 2025 được kỳ vọng sẽ vượt mức 300.000 người ở WAIC 2024 - Ảnh: AFP

Những bước tiến lớn của Trung Quốc trong quá trình trở thành cường quốc AI

Tại WAIC 2025, Tencent và SenseTime đã ra mắt mô hình AI mới rất đáng chú ý.

Tencent (tập đoàn mạng xã hội và game đình đám có trụ sở tại thành phố Thâm Quyến) đã giới thiệu Hunyuan 3D World Model 1.0 - mô hình AI mã nguồn mở có khả năng tạo ra các môi trường 3D (ba chiều) chi tiết, theo một thông cáo báo chí.

Tencent cho biết Hunyuan 3D World Model 1.0 có thể tạo ra các cảnh 3D tương tác toàn cảnh 360 độ chỉ bằng cách nhập lệnh ngôn ngữ tự nhiên hoặc hình ảnh, từ đó đơn giản hóa đáng kể quy trình sản xuất trải nghiệm thực tế ảo (VR) và video game.

Tập đoàn này nhấn mạnh Hunyuan 3D World Model 1.0 là mô hình AI mã nguồn mở đầu tiên trong ngành có khả năng tạo thế giới 3D tương thích hoàn toàn với CG pipelines - quy trình làm việc tiêu chuẩn được sử dụng để tạo đồ họa và hoạt hình 3D cho sản xuất phim, game, hiệu ứng hình ảnh.

Thuật toán nền tảng của Tencent, được giới thiệu với tên gọi “biểu diễn và tạo cảnh 3D phân cấp theo ngữ nghĩa”, có khả năng phân tách các thế giới 3D phức tạp thành những lớp dựa trên ý nghĩa, từ đó giúp tạo ra hiệu ứng chân thực và cho phép người dùng chỉnh sửa môi trường đã tạo.

Mô hình này hỗ trợ xuất 3D mesh (lưới 3D) - đối tượng 3D tiêu chuẩn có thể được nhập trực tiếp vào các công cụ phát triển game phổ biến như Unity và Unreal, cũng như phần mềm dựng hình chuyên nghiệp, mở rộng khả năng ứng dụng thực tế.

Hiện tại, Hunyuan 3D World Model 1.0 đã có mặt trên nền tảng tạo dựng 3D Hunyuan của Tencent, cho phép người dùng tạo ra ảnh toàn cảnh tĩnh bằng lệnh văn bản hoặc hình ảnh, nhưng số lượng sử dụng mỗi ngày bị giới hạn. Khả năng tạo cảnh tương tác và có thể khám phá theo bốn hướng, cho phép di chuyển ảo, đang được thử nghiệm nội bộ.

Ngoài ra, mô hình mới cũng đã được Tencent phát hành trên các nền tảng AI mã nguồn mở, gồm cả Hugging Face, để triển khai cục bộ. Đây là bước đi phù hợp với xu hướng mã nguồn mở trong ngành AI, nối tiếp việc Tencent từng phát hành nhiều mô hình AI đa phương thức mã nguồn mở trong dòng Hunyuan trước đó.

Hình ảnh do Hunyuan3D World Model 1.0 tạo ra, được Tencent công bố tại WAIC 2025 vào ngày 27.7 - Ảnh: Handout

Hình ảnh do Hunyuan3D World Model 1.0 tạo ra, được Tencent công bố tại WAIC 2025 vào ngày 27.7 - Ảnh: Handout

Hugging Face là nền tảng và cộng đồng trực tuyến hàng đầu trong lĩnh vực AI và học máy, đặc biệt nổi tiếng với các công cụ và mô hình liên quan đến xử lý ngôn ngữ tự nhiên.

Ở WAIC 2025, SenseTime (một trong những công ty tiên phong về AI tại Trung Quốc) đã công bố SenseNova V6.5 - thế hệ mới nhất trong dòng mô hình AI độc quyền của mình.

SenseTime tuyên bố SenseNova V6.5 đã vượt qua một số đối thủ từ Mỹ như Google Gemini 2.5 Pro và Claude 4-Sonnet của Anthropic. Việc giới thiệu SenseNova V6.5 đánh dấu nỗ lực mới nhất của SenseTime (niêm yết tại Hồng Kông, Trung Quốc) nhằm tăng cường đầu tư vào các mô hình AI đa phương thức, theo lời Chủ tịch kiêm Giám đốc điều hành Xu Li tại WAIC 2025.

Lần ra mắt này diễn ra sau khi SenseTime trình làng mô hình AI đa phương thức SenseNova V6 vào tháng 4, được cho là đã vượt qua GPT-4o của OpenAI ở nhiều chỉ số đánh giá.

Ông Xu Li cũng ca ngợi hiệu suất cải thiện của SenseNova V6.5 so với thế hệ trước, với hiệu quả học tăng cường trong giai đoạn huấn luyện tăng 40%, còn khả năng xử lý dữ liệu ở giai đoạn suy luận tăng hơn 35%.

“Chúng tôi đã thay đổi kiến trúc của một số mô hình cho SenseNova V6.5, để có thể xử lý tốt hơn việc tích hợp nhiều phương thức đầu vào, không chỉ là hình ảnh, mà còn có cả video và văn bản”, Xu Li phát biểu tại WAIC 2025.

Không giống các mô hình ngôn ngữ lớn truyền thống vốn tập trung chủ yếu vào văn bản, mô hình AI đa phương thức tích hợp nhiều loại dữ liệu đầu vào như hình ảnh, âm thanh, video nhằm nâng cao khả năng hiểu và tạo nội dung.

Nhà phân tích Wei Xiong thuộc hãng UBS Securities nhận định: “Chúng tôi nhận thấy AI đang thúc đẩy quá trình sản xuất nội dung đa phương thức (văn bản, hình ảnh, âm thanh và video) với quy mô lớn và tiết kiệm chi phí”. Ông chỉ ra rằng các mô hình của Trung Quốc “đang gặt hái thành công ban đầu trong lĩnh vực tạo video bằng AI”.

UBS Securities là bộ phận chứng khoán của UBS Group AG, tập đoàn tài chính hàng đầu có trụ sở tại Thụy Sĩ.

Số lượng mô hình phản ánh những bước tiến lớn của Trung Quốc trong quá trình trở thành cường quốc AI thông qua các sáng kiến phát triển mã nguồn mở, được hỗ trợ cả từ khu vực tư nhân và nhà nước, giúp thu hẹp khoảng cách với Mỹ.

Cách tiếp cận mã nguồn mở cho phép công chúng truy cập mã nguồn của một chương trình. Từ đó, các nhà phát triển phần mềm bên thứ ba có thể chỉnh sửa hoặc chia sẻ thiết kế của nó, sửa lỗi hoặc mở rộng các tính năng của chương trình.

Các mô hình AI mã nguồn mở hàng đầu thế giới ở Trung Quốc

Theo LMArena, Trung Quốc hiện là nơi sở hữu các mô hình AI mã nguồn mở hàng đầu thế giới. LMArena là nền tảng đánh giá AI được các nhà nghiên cứu Đại học California – Berkeley (Mỹ) phát triển.

Ở chuyến thăm Trung Quốc gần đây, Jensen Huang (Giám đốc điều hành Nvidia) đã ca ngợi sự tiến bộ của nước này ở lĩnh vực AI mã nguồn mở, khi gã khổng lồ chip Mỹ chuẩn bị nối lại việc giao chip H20 sang một trong những thị trường lớn nhất với hãng. Động thái này diễn ra sau bước đột phá trong đàm phán thương mại Mỹ - Trung hồi tháng 6.

Ông Jensen Huang nhận định rằng Qwen của Alibaba, DeepSeek-R1 cùng Kimi của Moonshot AI là “những mô hình suy luận nguồn mở tốt nhất thế giới hiện nay” và đều “rất tiên tiến”.

Alibaba và Huawei tận dụng thời cơ

Do các gã khổng lồ AI Mỹ như OpenAI, Google và Meta Platforms không tham gia WAIC 2025 (diễn ra từ 26 đến 28.7), các hãng công nghệ lớn tại Trung Quốc, từ Alibaba đến Huawei, tận dụng cơ hội trình làng những sản phẩm AI mới nhất của họ.

Alibaba đã ra mắt mô hình đa phương thức lớn mới nhất, dựa trên dòng mô hình Qwen AI của hãng, được thiết kế đặc biệt cho các hệ thống buồng lái ô tô thông minh.

Dự án này được đồng phát triển với hãng chip di động Qualcomm (Mỹ) và Banma - đơn vị chuyên cung cấp giải pháp buồng lái thông minh cho Alibaba.

Robot điều khiển từ xa của Unitree Robotics nằm trên sàn trong trận đấu quyền anh tại WAIC 2025 - Ảnh: AFP

Robot điều khiển từ xa của Unitree Robotics nằm trên sàn trong trận đấu quyền anh tại WAIC 2025 - Ảnh: AFP

Ở mảng phần cứng AI, các doanh nghiệp bán dẫn Trung Quốc, gồm cả Huawei, Moore Threads và Enflame (do Tencent hậu thuẫn), đã giới thiệu các công nghệ chip AI mới nhất của họ.

Chiếm vị trí quan trọng tại Trung tâm Triển lãm và Hội nghị Thế giới Thượng Hải, Huawei đã công bố hệ thống Supernode 384 - cụm gồm 384 chip AI Ascend. Supernode 384 cung cấp hiệu suất điện toán lên tới 300 petaflops và bộ nhớ băng thông cao 48 terabyte, thu hút sự chú ý tại Trung Quốc như một phương án thay thế cho hệ thống NVL72 của Nvidia. (1 petaflop tương đương 1 triệu tỉ phép tính mỗi giây).

WAIC 2025 cũng ghi nhận xu hướng ngày càng gia tăng giữa các nhà cung cấp hạ tầng AI Trung Quốc trong việc hợp tác xây dựng nguồn lực điện toán thương mại, nhằm đáp ứng nhu cầu điện toán tiên tiến đang tăng mạnh trong lĩnh vực AI tại nước này.

Suanova đã tham gia vào dự án Shanghai Cube - sáng kiến điện toán mật độ cao, quy tụ nhiều công ty và tổ chức trong nước, gồm các hãng chip AI như MetaX, nhà cung cấp hạ tầng điện toán Infinigence AI, Đại học Phục Đán và Luxshare Precision Industry (đối tác chuyên sản xuất AirPods và iPhone cho Apple).

Suanova chuyên cung cấp các giải pháp, dịch vụ về sức mạnh điện toán AI và cơ sở hạ tầng điện toán đám mây.

MetaX là công ty hoạt động trong lĩnh vực sản xuất chip AI, đặc biệt tập trung vào phần cứng AI hiệu năng cao dùng cho các trung tâm dữ liệu, điện toán đám mây và mô hình ngôn ngữ lớn.

Thủ tướng Trung Quốc Lý Cường đã dự lễ khai mạc WAIC 2025 hôm 26.7, kêu gọi thành lập một trung tâm quốc tế nhằm điều phối hợp tác AI toàn cầu.

Dù ban tổ chức WAIC 2025 chưa công bố số lượng khách tham quan, con số này được kỳ vọng sẽ vượt mức 300.000 người ở WAIC 2024 - kỷ lục cao nhất kể từ khi hội nghị này được tổ chức lần đầu hồi 2018.

Sơn Vân

Nguồn Một Thế Giới: https://1thegioi.vn/waic-2025-trung-quoc-tang-toc-voi-1-509-mo-hinh-ai-chiem-hon-40-toan-cau-235489.html
Zalo