AI sắp đánh bại những thí sinh giỏi nhất của Olympic Toán Quốc tế?
Công cụ giải toán mang tên AlphaGeometry2 của Google DeepMind đã có sự cải tiến so với phiên bản trước, giải được 84% đề thi hình học IMO trong 25 năm qua.
![Công cụ AI mới của Google có thể giải đề thi IMO tốt hơn phiên bản trước. Ảnh: Sabeswings.](https://photo-baomoi.bmcdn.me/w500_r1/2025_02_12_119_51457321/7b57d5efe2a10bff52b0.jpg)
Công cụ AI mới của Google có thể giải đề thi IMO tốt hơn phiên bản trước. Ảnh: Sabeswings.
Một năm trước, AlphaGeometry, công cụ giải bài toán bằng trí tuệ nhân tạo (AI) do Google DeepMind tạo ra, đã khiến cả thế giới ngạc nhiên khi đạt thành tích ngang ngửa những thí sinh đoạt huy chương bạc trong kỳ thi Olympic Toán Quốc tế (IMO) - kỳ thi danh giá dành cho những học sinh trung học có năng khiếu về toán.
Hiện, Google DeepMind cho biết phiên bản nâng cấp của công cụ này, được gọi là AlphaGeometry2, đã vượt qua mức trung bình của những thí sinh đoạt huy chương vàng, theo Nature.
"Tôi nghĩ không lâu nữa, máy tính sẽ đạt điểm tuyệt đối trong kỳ thi IMO", nhà toán học Kevin Buzzard tại Imperial College London nhận định.
AlphaGeometry là gì?
AlphaGeometry là sự kết hợp của một mô hình ngôn ngữ chuyên biệt và một hệ thống biểu tượng - hệ thống không được đào tạo bằng cách học từ dữ liệu có sẵn mà sẽ có lý luận, logic được con người mã hóa.
Nhóm nghiên cứu đã đào tạo mô hình ngôn ngữ để AI sử dụng ngôn ngữ toán học, giúp nó có thể tự động kiểm tra đầu ra nhằm đảm bảo tính chặt chẽ về mặt logic và loại bỏ các nhận định phi logic, những lập luận không mạch lạc mà chatbot AI dễ mắc phải.
Trong đề thi IMO, thí sinh cần giải quyết những bài toán thuộc các chủ đề như hình học, lý thuyết số, đại số và tổ hợp. Với đề thi hình học, AI cần phải có "kỹ năng" cụ thể vì đề yêu cầu người làm bài cung cấp những luận điểm chặt chẽ về các đối tượng trên mặt phẳng.
Vào tháng 7/2024, AlphaGeometry2 đã ra mắt công chúng cùng với một hệ thống mới được công bố tên là AlphaProof. Hệ thống này được DeepMind phát triển để giải các câu hỏi không phải hình học trong các bộ câu hỏi IMO.
Trong kỳ thi IMO lần 65, AlphaProof cũng được cho giải đề thi. Kết quả, AI này đạt điểm tuyệt đối ở 2 bài đại số, một bài lý thuyết số và một bài hình học, đạt 28/42 điểm, ngang với thí sinh giành huy chương bạc.
GS Timothy Gowers tại Đại học Cambridge, Anh - người từng giành huy chương vàng IMO và huy chương Fields (năm 1998) - đánh giá hệ thống có thể đưa ra cấu trúc giải ấn tượng và vượt xa những gì ông nghĩ là tiên tiến nhất.
Tuy nhiên, khác với thí sinh IMO, AlphaProof không bị giới hạn thời gian giải đề. Trong khi thí sinh IMO chỉ được làm bài trong thời gian 4,5 giờ/ngày, công cụ này lại được nhiều thời gian hơn, thậm chí mất đến 3 ngày để giải một bài toán.
![Các nhà nghiên cứu mong chờ kỳ thi IMO lần thứ 66 để cho công cụ mới giải đề. Ảnh: Google DeepMind.](https://photo-baomoi.bmcdn.me/w500_r1/2025_02_12_119_51457321/a4810d393a77d3298a66.jpg)
Các nhà nghiên cứu mong chờ kỳ thi IMO lần thứ 66 để cho công cụ mới giải đề. Ảnh: Google DeepMind.
Cải tiến mạnh hơn
Giờ đây, đối với AlphaGeometry2, nhóm nghiên cứu thực hiện một số cải tiến, bao gồm tích hợp mô hình ngôn ngữ lớn hiện đại của Google là Gemini. Công cụ mới này có khả năng giải phương trình tuyến tính, đưa ra lập luận bằng cách di chuyển các đối tượng hình học xung quanh mặt phẳng, ví dụ như di chuyển một điểm chạy dọc theo đường thẳng để thay đổi chiều cao của hình tam giác.
Đáng chú ý, AlphaGeometry2 có thể giải quyết 84% đề thi hình học IMO trong 25 năm qua, trong khi biên bản cũ chỉ có thể giải được 54%.
Từ những kết quả hiện tại, nhóm nghiên cứu nêu rằng họ sẽ tiếp tục cải tiến AlphaGeometry trong tương lai, bao gồm khả năng giải quyết các bài toán liên quan bất đẳng thức và phương trình phi tuyến tính - yếu tố cần thiết để giải quyết trọn vẹn đề toán hình.
Nói thêm về những cải tiến mới, ông Kevin Buzzard cho biết ông không ngạc nhiên khi DeepMind có thể phát triển nhanh chóng như vậy. Nhưng dù vậy, các công cụ AI như AlphaGeometry2 vẫn còn nhiều thách thức cần vượt qua mới có thể giải các bài toán ở cấp độ nghiên cứu.
Tháng 7 sắp tới, kỳ thi IMO lần thứ 66 sẽ được tổ chức tại Sunshine Coast (Australia). Các nhà nghiên cứu AI rất háo hức chờ đón kỳ thi này vì khi đề thi được công khai, họ sẽ cho AI giải thử để đánh giá kết quả.