Meta, NIC và AIV hợp tác đưa tiếng Việt lên 'bản đồ AI' toàn cầu
Dự án ViGen nằm trong chương trình 'Thách thức đổi mới sáng tạo Việt Nam 2025', hướng đến xây dựng bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao, đủ quy mô phục vụ đào tạo và đánh giá các mô hình AI hiện đại.

Ông Sarim Aziz, Giám đốc Chính sách Công của Meta chia sẻ về chiến lược của tập đoàn trong việc hỗ trợ Việt Nam phát triển AI
Ngày 14/3, tại Hà Nội, Meta phối hợp cùng Trung tâm Đổi mới sáng tạo Quốc gia (NIC, Bộ Tài chính) phát động Chương trình Thách thức Đổi mới sáng tạo 2025. Đây là năm thứ ba liên tiếp chương trình được tổ chức với sứ mệnh thúc đẩy sự phát triển của lĩnh vực Trí tuệ nhân tạo (AI) tại Việt Nam.
Phiên bản 2025 của chương trình đánh dấu bước tiến quan trọng khi tập trung vào Dự án ViGen (xây dựng bộ dữ liệu tiếng Việt mã nguồn mở quy mô lớn, chất lượng cao phục vụ trực tiếp cho việc phát triển các mô hình ngôn ngữ lớn - LLMs).
ViGen mong muốn góp phần thúc đẩy khả năng hiểu biết của các mô hình AI về văn hóa, ngữ cảnh và đặc thù ngôn ngữ Việt Nam, mở đường cho những ứng dụng AI mang tính đột phá trong nền kinh tế số Việt Nam.
ViGen: Nền tảng chiến lược đưa tiếng Việt lên bản đồ AI toàn cầu
Dự án ViGen được triển khai bởi sự hợp tác chặt chẽ giữa ba đối tác: Tập đoàn Meta, Trung tâm Đổi mới sáng tạo Quốc gia (NIC) và tổ chức AI for Vietnam.
Trong đó, NIC đóng vai trò chủ trì, điều phối và định hướng dự án phù hợp với các chiến lược phát triển quốc gia. AI for Vietnam, dưới sự hỗ trợ kỹ thuật và tài chính từ Meta, đảm nhận triển khai các hạng mục cụ thể của dự án.
Ngoài ra, các đối tác chiến lược như NVIDIA, Viettel, và Viện Hàn lâm Khoa học và Công nghệ Việt Nam cũng tham gia đồng hành, góp phần tạo nên một hệ sinh thái hợp tác bền vững.
Sứ mệnh chính của ViGen là xây dựng các bộ dữ liệu tiếng Việt mã nguồn mở, có chất lượng cao và đủ quy mô để phục vụ việc đào tạo và đánh giá các mô hình AI hiện đại. Việc này không chỉ giúp các mô hình hiểu và vận hành tiếng Việt một cách tự nhiên, mà còn bảo đảm rằng các tiêu chuẩn đạo đức, giá trị văn hóa của Việt Nam được lồng ghép trong quá trình phát triển AI.
Ông Võ Xuân Hoài, Phó Giám đốc NIC, khẳng định: “AI đang làm thay đổi thế giới từng ngày. Đối với Việt Nam, việc phát triển các tập dữ liệu tiếng Việt chất lượng cao và mã nguồn mở là một trong những ưu tiên quan trọng nhằm thúc đẩy đột phá về công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia”.
Theo Giáo sư Yann LeCun, Phó Chủ tịch và Kiến trúc sư trưởng AI của Meta, dự án ViGen cùng Thách thức đổi mới sáng tạo Việt Nam mang ý nghĩa vượt xa khuôn khổ công nghệ. Đó là sự khẳng định vai trò của Việt Nam trên bản đồ AI toàn cầu, đồng thời bảo tồn và tôn vinh ngôn ngữ, văn hóa Việt Nam trong thời đại trí tuệ nhân tạo.
“Chúng tôi không chỉ tạo ra công nghệ, mà còn xây dựng một tương lai AI toàn diện và gắn liền với những giá trị bản địa”, ông Yann LeCun nhấn mạnh.
Meta sẽ đóng góp thêm vào dự án ViGen thông qua các bộ dữ liệu mở trong chương trình AI và Dữ liệu vì Lợi ích Cộng đồng. Các dữ liệu này bao gồm thông tin về di chuyển, kết nối xã hội và bản đồ dân số hỗ trợ AI, giúp thúc đẩy nghiên cứu và ứng dụng AI trong nhiều lĩnh vực khác nhau.

Ông Trần Việt Hùng, CEO tổ chức AI for Vietnam chia sẻ về dự án ViGen
Ông Trần Việt Hùng, CEO Tổ chức AI for Vietnam, cho biết dự án ViGen sẽ giúp cải thiện đáng kể tình trạng tiếng Việt hiện nay đang bị hạn chế trong kho dữ liệu AI toàn cầu. Bên cạnh đó, ViGen cũng đóng góp vào Sáng kiến Dữ liệu mở và Tin cậy (OTDI) thuộc Liên minh AI Toàn cầu mà AI for Vietnam là một thành viên chính thức.
Khai phá tiềm năng AI mã nguồn mở: Việt Nam dẫn đầu Châu Á - Thái Bình Dương với Llama
Bên cạnh Dự án ViGen, Meta và Deloitte đã lựa chọn Việt Nam làm quốc gia đầu tiên trong khu vực Châu Á - Thái Bình Dương để ra mắt cuốn cẩm nang “Đổi mới sáng tạo trong khu vực công ở Châu Á - Thái Bình Dương với AI mã nguồn mở: Khai phá tiềm năng đột phá cùng Llama”.
Cuốn cẩm nang được kỳ vọng hỗ trợ tốt cho các cơ quan chức năng trong việc áp dụng hiệu quả AI mã nguồn mở, là tài liệu thực tế giúp triển khai các mô hình AI phù hợp với điều kiện và nhu cầu các địa phương.
Ông Sarim Aziz, Giám đốc Chính sách Công của Meta nhấn mạnh: "Thông qua những mô hình mã nguồn mở như Llama, chúng tôi hy vọng giúp các tổ chức và doanh nghiệp Việt Nam khai phá toàn bộ tiềm năng AI”.
Theo báo cáo được công bố tại sự kiện, có hai ứng dụng tiêu biểu từ mô hình Llama đã được triển khai thành công tại Việt Nam: Bộ Khoa học và Công nghệ đã phối hợp cùng MISA phát triển một trợ lý ảo giúp giảm tới 98% thời gian tra cứu thông tin cho cán bộ, tăng năng suất công việc; Bộ Tư pháp và Viettel ứng dụng Llama để xây dựng trợ lý pháp lý ảo, rút ngắn 30% thời gian nghiên cứu văn bản pháp luật.
Ông Chris Lewin, Giám đốc Năng lực AI và Dữ liệu khu vực Châu Á - Thái Bình Dương của Deloitte, nhấn mạnh: “AI mã nguồn mở là động lực thúc đẩy chuyển đổi số trong khu vực công. Thông qua báo cáo này, chúng tôi muốn giúp các cơ quan quản lý và tổ chức tại Việt Nam hiểu rõ hơn về các ứng dụng AI thế hệ mới, trên nền tảng những nguyên tắc minh bạch và đáng tin cậy”.
Theo ban tổ chức, với quy mô ngày càng mở rộng, chương trình ghi nhận sự tham gia của hơn 750 giải pháp đến từ hơn 20 quốc gia và vùng lãnh thổ kể từ lần tổ chức đầu tiên năm 2022.
Chương trình Thách thức Đổi mới sáng tạo Việt Nam không chỉ là sân chơi công nghệ mà còn trở thành biểu tượng hợp tác quốc tế.
Trong chuyến của Tổng thống Joe Biden tới Việt Nam năm 2023, sáng kiến này đã được Cổng thông tin Nhà Trắng đánh giá cao, coi đây là một điểm nhấn trong hợp tác đổi mới sáng tạo và công nghệ giữa Việt Nam và Hoa Kỳ.