Alibaba ra mắt mô hình AI chuyên về toán học, tuyên bố vượt mặt OpenAI, Google

11/8/2024 Gốc

Gã khổng lồ thương mại điện tử này tuyên bố rằng hệ thống AI mới có thể vượt trội hơn khả năng của GPT-4o của OpenAI trong lĩnh vực toán học.

Alibaba ra mắt mô hình AI chuyên về toán học, tuyên bố vượt mặt OpenAI, Google. Ảnh: SCMP

Alibaba Group Holding đang đặt mục tiêu nâng cao tiêu chuẩn trong việc phát triển trí tuệ nhân tạo (AI) bằng cách ra mắt một nhóm các mô hình ngôn ngữ lớn (LLM) chuyên về toán học có tên là Qwen2-Math. Gã khổng lồ thương mại điện tử này tuyên bố rằng hệ thống này có thể vượt trội hơn khả năng của GPT-4o của OpenAI trong lĩnh vực toán học.

“Trong năm qua, chúng tôi đã dành nhiều nỗ lực đáng kể để nghiên cứu và nâng cao khả năng lý luận của các mô hình ngôn ngữ lớn, đặc biệt tập trung vào khả năng giải quyết các bài toán số học”, nhóm Qwen, một bộ phận của đơn vị điện toán đám mây Alibaba, cho biết trong một bài đăng được công bố trên nền tảng dành cho nhà phát triển GitHub vào hôm 9/8.

Được biết các LLM mới nhất (công nghệ hỗ trợ các dịch vụ AI tạo sinh như ChatGPT) được xây dựng trên các LLM Qwen2 do Alibaba phát hành vào tháng 6.

Theo bài đăng của nhóm Qwen, mô hình có số lượng tham số lớn nhất, Qwen2-Math-72B-Instruct, đã vượt trội hơn các LLM độc quyền do Hoa Kỳ phát triển trong các chuẩn mực toán học. Những chuẩn mực đó bao gồm GPT-4o, Claude 3.5 Sonnet của Anthropic, Gemini 1.5 Pro của Google và Llama -3.1-405B của Meta Platforms.

Bài đăng cho biết: "Chúng tôi hy vọng Qwen2-Math có thể đóng góp cho cộng đồng trong việc giải quyết các bài toán phức tạp".

Theo bài đăng, các mô hình AI Qwen2-Math đã được thử nghiệm trên cả chuẩn toán tiếng Anh và tiếng Trung. Trong đó bao gồm GSM8K, một tập dữ liệu gồm 8.500 bài toán tiểu học đa dạng về mặt ngôn ngữ chất lượng cao; OlympiadBench, một chuẩn khoa học đa phương thức song ngữ cấp cao và gaokao, kỳ thi tuyển sinh đại học khó khăn của Trung Quốc đại lục.

Nhóm Qwen cho biết các mô hình mới vẫn còn một số hạn chế do "chỉ hỗ trợ tiếng Anh". Theo nhóm, kế hoạch là sớm phát hành các mô hình song ngữ, với các LLM đa ngôn ngữ cũng đang trong quá trình phát triển.

Các mô hình toán học cụ thể của Alibaba càng củng cố thêm uy tín về AI của công ty có trụ sở tại Hàng Châu này sau khi chương trình LLM Qwen-72B-Instruct của công ty gần đây đã dẫn đầu bảng xếp hạng 10 mô hình nguồn mở hàng đầu thế giới.

Được biết, Tongyi Qianwen đã mở cửa cho các nhà phát triển bên thứ ba trong hơn một năm. Mã nguồn mở cung cấp quyền truy cập công khai vào mã nguồn của chương trình, cho phép các nhà phát triển phần mềm bên thứ ba sửa đổi hoặc chia sẻ thiết kế và mở rộng khả năng của chương trình.

Vào tháng 7, Qwen2-72B-Instruct xếp ngay sau GPT-4o và Claude 3.5 Sonnet trong bảng xếp hạng LLM của SuperClue, một nền tảng đánh giá các mô hình dựa trên các số liệu như tính toán, suy luận logic, mã hóa và khả năng đọc hiểu văn bản, cùng nhiều số liệu khác.

Theo SuperClue, khoảng cách giữa các mô hình AI của Trung Quốc và Hoa Kỳ dường như đang thu hẹp lại khi Trung Quốc đại lục đã đạt được tiến bộ đáng kể trong việc thúc đẩy các chương trình LLM trong nước trong nửa đầu năm nay.

Một bài kiểm tra riêng biệt được công bố vào tháng 7 bởi LMSYS - một tổ chức nghiên cứu mô hình AI được Đại học California, Berkeley hỗ trợ - cho thấy Qwen2-72B được xếp hạng 20, trong khi các mô hình độc quyền từ OpenAI, Anthropic và Google chiếm hầu hết các vị trí trong top 10.

Theo SCMP

Tiến Dũng