DeepSeek phá kỷ lục

21 giờ trước Gốc

Deepseek công bố mô hình mới với khả năng tự tạo và kiểm chứng lời giải toán học, mở ra cuộc cạnh tranh minh bạch hiếm thấy giữa các phòng thí nghiệm AI lớn.

Mô hình DeepseekMath-V2 đạt hiệu suất khủng khi giải toán. Ảnh: Decoder.

Deepseek vừa công bố mô hình DeepseekMath-V2, mô hình đạt thành tích tương đương huy chương vàng tại hàng loạt cuộc thi toán học uy tín. Động thái này đặt công ty của Trung Quốc vào vị trí cạnh tranh trực tiếp với các phòng thí nghiệm AI hàng đầu của Mỹ, vốn dẫn đầu trong khả năng suy luận của mô hình ngôn ngữ.

Theo tài liệu kỹ thuật, DeepseekMath-V2 đạt kết quả ở mức huy chương vàng tại Olympic Toán học quốc tế (IMO) 2025 và kỳ thi CMO Trung Quốc 2024. Trong kỳ thi Putnam, mô hình ghi 118/120 điểm, vượt xa mốc 90 điểm của thí sinh con người đạt điểm cao nhất trong lịch sử. Những kết quả này là minh chứng cho khả năng xử lý các bài toán phức tạp.

Công ty Trung Quốc giải thích rằng hạn chế của các mô hình AI trước đây nằm ở việc dù có thể đưa ra đáp án đúng, chúng lại không trình bày được lời giải hợp lệ. Để khắc phục, DeepseekMath-V2 sử dụng quy trình nhiều giai đoạn gồm để đánh giá tính đúng đắn, kiểm tra các phản biện và đưa ra kết quả sau cùng. Cách vận hành này cho phép hệ thống tự rà soát và tinh chỉnh lời giải theo thời gian thực, tránh tình trạng kết luận đúng nhưng lập luận sai.

Điểm đáng chú ý là tài liệu của Deepseek không nhắc đến việc mô hình sử dụng công cụ bên ngoài như máy tính hay trình thông dịch mã. Thiết lập thử nghiệm cho thấy mọi kết quả được tạo ra hoàn toàn bằng ngôn ngữ tự nhiên.

Deepseek nhấn mạnh rằng hiệu suất đạt được đến từ khả năng tự phê bình và tự điều chỉnh lời giải, không dựa vào phần mềm toán học chuyên dụng. Đối với các bài toán khó, hệ thống tăng quy mô tính toán bằng cách tạo nhiều đáp án song song, từ đó nâng độ tin cậy của kết quả sau cùng.

Sự xuất hiện của DeepseekMath-V2 diễn ra ngay sau khi OpenAI và Google DeepMind thông báo các mô hình chưa công bố của họ cũng đạt mức huy chương vàng tại IMO. Đây là thành tích từng nằm ngoài khả năng của mô hình ngôn ngữ lớn. Tuy vậy, thông tin về các hệ thống này hiện rất hạn chế, ngoại trừ việc một nhà nghiên cứu của OpenAI cho biết phiên bản toán học mạnh hơn sẽ xuất hiện trong vài tháng tới.

Trái ngược với sự bí mật từ các công ty Mỹ, Deepseek lựa chọn công bố chi tiết phương pháp và kiến trúc kỹ thuật. Cách tiếp cận này giúp hãng thể hiện sự minh bạch, đồng thời tạo áp lực cạnh tranh lên hệ sinh thái AI của Mỹ. Theo The Economist, một số startup của Mỹ đã cân nhắc chuyển sang dùng mô hình nguồn mở giá rẻ từ Trung Quốc để tiết kiệm chi phí.

Minh Hoàng

Nguồn Znews: https://znews.vn/deepseek-pha-ky-luc-post1606990.html

DeepSeek phá kỷ lục

Deepseek công bố mô hình mới với khả năng tự tạo và kiểm chứng lời giải toán học, mở ra cuộc cạnh tranh minh bạch hiếm thấy giữa các phòng thí nghiệm AI lớn.

TIN KHÁC

Tham vọng siêu máy tính của Mexico

Công ty AI 'nóng' nhất hiện nay là... Google?

Khủng hoảng chip nhớ khi AI bùng nổ

TIN NÓNG

Trận đấu của Juventus bị cắt sóng ở Việt Nam

Chỉ làm thủ tục tại quầy đối với hành khách có hành lý ký gửi và đặc biệt ở sân bay từ 1/12

Thông tin đáng lo về già hóa dân số ở Hàn Quốc, Nhật Bản

Garmin Venu 4, huấn luyện viên sức khỏe trên tay

Toàn bộ máy bay của các hãng Việt trở lại khai thác sau sự cố phần mềm Airbus

Xe bay Trung Quốc tăng tốc, phương Tây vẫn ì ạch

TIN MỚI

Việt Nam giảm sâu gian lận thẻ, vượt chuẩn an toàn khu vực

Khởi nghiệp từ 'rác' nông nghiệp

Airbus triệu hồi khẩn cấp 6.000 máy bay toàn cầu

Cảm biến 200MP của Sony khiến Samsung 'toát mồ hôi'

Dấu ấn Giáo sư người Việt làm Viện sĩ Viện Hàn lâm Sáng tạo Quốc gia Hoa Kỳ

Học sinh sáng chế thùng rác thông minh tự phân loại, nén rác năng lượng sạch

'Mỏ neo' 100 tỷ USD giữ chân người dùng iPhone

Thứ trưởng Thường trực Bộ Khoa học và Công nghệ nhận nhiệm vụ mới