AI ngang thí sinh giành huy chương bạc Olympic Toán quốc tế 2024?
Hệ thống AlphaProof đã đạt 28/42 điểm với đề thi Olympic Toán quốc tế - thành tích ngang với thí sinh giành huy chương bạc - nhưng vẫn còn một số khác biệt.
Tuần trước, các nhà nghiên cứu của Google DeepMind, bộ phận nghiên cứu trí tuệ nhân tạo (AI) của Google, tiếp tục gây tiếng vang khi một hệ thống AI giải được 4/6 bài của đề thi Olympic Toán quốc tế (IMO) năm nay.
Hệ thống AlphaProof đã đạt 28/42 điểm, ngang với thí sinh giành huy chương bạc.
AI giải được 4 bài IMO
IMO lần thứ 65 được tổ chức từ ngày 11/7 đến ngày 22/7 tại Vương quốc Anh. Năm nay, 609 học sinh đến từ 109 quốc gia và vùng lãnh thổ đã giành được 58 huy chương vàng, 123 huy chương bạc và 145 huy chương đồng.
Trong khi thí sinh dự thi, AlphaProof cũng tham gia giải đề. AI này đạt điểm tuyệt đối ở 2 bài đại số, một bài số học và một bài hình học (hệ thống đã thất bại trong 2 bài toán tổ hợp).
Tuy nhiên, AlphaProof được phép sử dụng thời gian không giới hạn. Với một số bài toán, nó mất tới 3 ngày để giải, trong khi học sinh chỉ được phép thi 4,5 giờ/ngày.
Bài làm do AIphaProof thực hiện được chấm bởi hai giám khảo, gồm GS Timothy Gowers của Đại học Cambridge, Anh - người từng giành huy chương vàng IMO và huy chương Fields (năm 1998) và TS Joseph Myers, chủ tịch hội đồng ra đề IMO năm nay, từng là điều phối viên, người chấm điểm tại các kỳ IMO trước.
"Tôi chấm điểm bài làm do AI giải tương tự cách chấm đối với một thí sinh IMO", TS Joseph nói.
Trong khi đó, GS Timothy Gowers đánh giá hệ thống có thể đưa ra cấu trúc giải ấn tượng và vượt xa những gì ông nghĩ là tiên tiến nhất. "Nó đã tìm ra 'chìa khóa ma thuật' để giải quyết vấn đề Toán học", ông nói.
Cách AI giải Toán
Theo New York Times, những năm gần đây, việc áp dụng AI vào Toán học đã là một phần trong "sứ mệnh" của DeepMind. Các bài Toán Olympic đã trở thành một tiêu chuẩn đánh giá.
Hồi tháng 1, một hệ thống khác của Google DeepMind có tên AlphaGeometry có thể giải các bài toán hình học phức tạp một cách chính xác và hiệu quả, ngang ngửa với thí sinh giành huy chương vàng IMO. Ở đề thi năm nay, mô hình này đã hoàn thành bài hình học trong vòng 19 giây.
Tiếp đà phát triển, Google DeepMind đã tăng cường thêm AlphaProof - hệ thống do Thomas Hubert (kỹ sư nghiên cứu tại London, Anh) dẫn đầu, được thiết kế để tham gia vào một loạt các chủ đề Toán học.
AlphaProof tích hợp nhiều công nghệ AI để tự đào tạo khả năng làm Toán. Trong đó, mô hình ngôn ngữ lớn tự nhiên Gemini được dùng làm kho dữ liệu đầu vào về các bài Toán, các chứng minh đã công bố và những kiến thức liên quan. Đây là cách tiếp cận một hệ thống lập luận không chính thức.
Một cách tiếp cận khác là hệ thống lập luận chính thức, dựa trên logic và được thể hiện bằng mã. Nó sử dụng phần mềm chứng minh và hỗ trợ chứng minh gọi là Lean, đảm bảo khi hệ thống nói rằng một chứng minh là đúng, thì nó thực sự đúng.
"Chúng tôi có thể kiểm tra chính xác xem chứng minh là đúng hay sai. Mỗi bước đều được đảm bảo về mặt logic", Hubert nói.
Một phần quan trọng khác của AlphaProof là áp dụng thuật toán học tăng cường của AlphaGo và AlphaZero để liên tục nạp thêm kiến thức, giải bài đến khi ra đáp số.
Ngoài ra, AlphaProof kết hợp với AlphaGeometry 2, phiên bản mới của AlphaGeometry.
"Nó vẫn chưa hoàn hảo, chúng tôi chưa giải quyết được tất cả. Chúng tôi muốn nó trở nên hoàn hảo", TS Pushmeet Kohli, Phó chủ tịch nghiên cứu của Google DeepMind, cho biết trong một cuộc phỏng vấn. Tuy nhiên, ông mô tả kết quả này là một "bước ngoặt" trong áp dụng AI để giải quyết các vấn đề Toán học.