AI sắp đánh bại những thí sinh giỏi nhất của Olympic Toán Quốc tế?

3 giờ trước Gốc

Công cụ giải toán mang tên AlphaGeometry2 của Google DeepMind đã có sự cải tiến so với phiên bản trước, giải được 84% đề thi hình học IMO trong 25 năm qua.

Công cụ AI mới của Google có thể giải đề thi IMO tốt hơn phiên bản trước. Ảnh: Sabeswings.

Một năm trước, AlphaGeometry, công cụ giải bài toán bằng trí tuệ nhân tạo (AI) do Google DeepMind tạo ra, đã khiến cả thế giới ngạc nhiên khi đạt thành tích ngang ngửa những thí sinh đoạt huy chương bạc trong kỳ thi Olympic Toán Quốc tế (IMO) - kỳ thi danh giá dành cho những học sinh trung học có năng khiếu về toán.

Hiện, Google DeepMind cho biết phiên bản nâng cấp của công cụ này, được gọi là AlphaGeometry2, đã vượt qua mức trung bình của những thí sinh đoạt huy chương vàng, theo Nature.

"Tôi nghĩ không lâu nữa, máy tính sẽ đạt điểm tuyệt đối trong kỳ thi IMO", nhà toán học Kevin Buzzard tại Imperial College London nhận định.

AlphaGeometry là gì?

AlphaGeometry là sự kết hợp của một mô hình ngôn ngữ chuyên biệt và một hệ thống biểu tượng - hệ thống không được đào tạo bằng cách học từ dữ liệu có sẵn mà sẽ có lý luận, logic được con người mã hóa.

Nhóm nghiên cứu đã đào tạo mô hình ngôn ngữ để AI sử dụng ngôn ngữ toán học, giúp nó có thể tự động kiểm tra đầu ra nhằm đảm bảo tính chặt chẽ về mặt logic và loại bỏ các nhận định phi logic, những lập luận không mạch lạc mà chatbot AI dễ mắc phải.

Trong đề thi IMO, thí sinh cần giải quyết những bài toán thuộc các chủ đề như hình học, lý thuyết số, đại số và tổ hợp. Với đề thi hình học, AI cần phải có "kỹ năng" cụ thể vì đề yêu cầu người làm bài cung cấp những luận điểm chặt chẽ về các đối tượng trên mặt phẳng.

Vào tháng 7/2024, AlphaGeometry2 đã ra mắt công chúng cùng với một hệ thống mới được công bố tên là AlphaProof. Hệ thống này được DeepMind phát triển để giải các câu hỏi không phải hình học trong các bộ câu hỏi IMO.

Trong kỳ thi IMO lần 65, AlphaProof cũng được cho giải đề thi. Kết quả, AI này đạt điểm tuyệt đối ở 2 bài đại số, một bài lý thuyết số và một bài hình học, đạt 28/42 điểm, ngang với thí sinh giành huy chương bạc.

GS Timothy Gowers tại Đại học Cambridge, Anh - người từng giành huy chương vàng IMO và huy chương Fields (năm 1998) - đánh giá hệ thống có thể đưa ra cấu trúc giải ấn tượng và vượt xa những gì ông nghĩ là tiên tiến nhất.

Tuy nhiên, khác với thí sinh IMO, AlphaProof không bị giới hạn thời gian giải đề. Trong khi thí sinh IMO chỉ được làm bài trong thời gian 4,5 giờ/ngày, công cụ này lại được nhiều thời gian hơn, thậm chí mất đến 3 ngày để giải một bài toán.

Các nhà nghiên cứu mong chờ kỳ thi IMO lần thứ 66 để cho công cụ mới giải đề. Ảnh: Google DeepMind.

Cải tiến mạnh hơn

Giờ đây, đối với AlphaGeometry2, nhóm nghiên cứu thực hiện một số cải tiến, bao gồm tích hợp mô hình ngôn ngữ lớn hiện đại của Google là Gemini. Công cụ mới này có khả năng giải phương trình tuyến tính, đưa ra lập luận bằng cách di chuyển các đối tượng hình học xung quanh mặt phẳng, ví dụ như di chuyển một điểm chạy dọc theo đường thẳng để thay đổi chiều cao của hình tam giác.

Đáng chú ý, AlphaGeometry2 có thể giải quyết 84% đề thi hình học IMO trong 25 năm qua, trong khi biên bản cũ chỉ có thể giải được 54%.

Từ những kết quả hiện tại, nhóm nghiên cứu nêu rằng họ sẽ tiếp tục cải tiến AlphaGeometry trong tương lai, bao gồm khả năng giải quyết các bài toán liên quan bất đẳng thức và phương trình phi tuyến tính - yếu tố cần thiết để giải quyết trọn vẹn đề toán hình.

Nói thêm về những cải tiến mới, ông Kevin Buzzard cho biết ông không ngạc nhiên khi DeepMind có thể phát triển nhanh chóng như vậy. Nhưng dù vậy, các công cụ AI như AlphaGeometry2 vẫn còn nhiều thách thức cần vượt qua mới có thể giải các bài toán ở cấp độ nghiên cứu.

Tháng 7 sắp tới, kỳ thi IMO lần thứ 66 sẽ được tổ chức tại Sunshine Coast (Australia). Các nhà nghiên cứu AI rất háo hức chờ đón kỳ thi này vì khi đề thi được công khai, họ sẽ cho AI giải thử để đánh giá kết quả.

Thái An

Đề thi

Nguồn Znews: https://lifestyle.znews.vn/ai-sap-danh-bai-nhung-thi-sinh-gioi-nhat-cua-olympic-toan-quoc-te-post1530650.html

AI sắp đánh bại những thí sinh giỏi nhất của Olympic Toán Quốc tế?

Công cụ giải toán mang tên AlphaGeometry2 của Google DeepMind đã có sự cải tiến so với phiên bản trước, giải được 84% đề thi hình học IMO trong 25 năm qua.

TIN KHÁC

Dự kiến 120.000 thí sinh thi đánh giá năng lực đợt 1 năm 2025 Đại học Quốc gia TP. Hồ Chí Minh

Nữ điều dưỡng đam mê màu áo lính

Nguyễn Quang Long – Đội trưởng thanh niên tình nguyện nhiệt huyết, cống hiến vì cộng đồng

TIN NÓNG

Tốt nghiệp đại học loại giỏi, chàng trai viết đơn tình nguyện nhập ngũ

Bình Thuận: GV, nhân viên trường THPT than thở vì bị chậm lương tháng 12/2024

Vượt 70.000 ứng viên, nữ sinh Việt trúng tuyển vào làm việc trong Chính phủ Úc

Người phụ nữ trọn đời đấu tranh vì bình đẳng trong giáo dục

Nhà trường có quyền tự quyết định tổ chức dạy thêm?

Sớm công bố môn thi thứ 3 vào lớp 10: Đáp ứng nguyện vọng học sinh, phụ huynh

TIN MỚI

Hà Giang: Thanh niên huyện vùng cao Mèo Vạc phấn khởi chờ ngày nhập ngũ

'Không học thêm, con '2k10' phải ôn thi thế nào?'

Điểm sáng tuyển quân trong đồng bào người Hoa

Nam sinh 'Sao Tháng Giêng' đam mê hoạt động tình nguyện

Hành trình tuổi trẻ của nam sinh viên VNU-SIS dấn thân và cống hiến

Từ 2025, ĐHQG TP. HCM chỉ cấp Giấy chứng nhận kết quả dạng điện tử cho kỳ thi Đánh giá năng lực

Sẵn sàng cho Lễ ra quân huấn luyện năm 2025

Một tỉnh bất ngờ công bố Lịch sử là môn thứ ba thi lớp 10