DeepseekMath-V2 tạo sức ép mới trong cuộc đua AI giải toán

Deepseek vừa giới thiệu mô hình DeepseekMath-V2, hệ thống được đánh giá có khả năng giải toán ở mức cao nhất hiện nay khi đạt thành tích tương đương huy chương vàng tại nhiều kỳ thi quốc tế.

Công bố này đưa Deepseek vào nhóm những phòng thí nghiệm AI sở hữu mô hình có năng lực suy luận mạnh, lĩnh vực vốn được xem là ưu thế của các công ty công nghệ Mỹ.

Tài liệu kỹ thuật cho thấy DeepseekMath-V2 đạt mức huy chương vàng tại Olympic Toán học quốc tế (IMO) 2025 và kỳ thi CMO Trung Quốc 2024. Trong kỳ thi Putnam, mô hình ghi 118/120 điểm, vượt xa mức 90 điểm do thí sinh con người có điểm số cao nhất từng đạt. Các kết quả này là cơ sở để giới nghiên cứu nhận định DeepseekMath-V2 đủ khả năng xử lý những bài toán nhiều bước có độ phức tạp cao.

deep_voh
Mô hình DeepseekMath-V2 đạt hiệu suất khủng khi giải toán. - Ảnh: Decoder.

Deepseek cho biết hạn chế của các mô hình AI trước đây nằm ở việc chúng có thể đưa ra kết quả đúng nhưng không trình bày được lời giải hợp lệ. DeepseekMath-V2 vận hành theo quy trình nhiều giai đoạn gồm đánh giá tính đúng sai, kiểm tra phản biện và chọn lời giải tối ưu. Quy trình này giúp hệ thống tự rà soát các bước lập luận, hạn chế sai sót trong quá trình suy luận.

Tài liệu công bố không đề cập việc mô hình sử dụng các công cụ hỗ trợ như máy tính hay trình thông dịch mã. Thiết lập thử nghiệm cho thấy mọi câu trả lời được tạo ra bằng ngôn ngữ tự nhiên, đồng nghĩa hệ thống tự hoàn thiện lập luận mà không dựa vào phần mềm toán học chuyên dụng.

Deepseek khẳng định hiệu suất của DeepseekMath-V2 đến từ khả năng tự điều chỉnh và tự kiểm chứng lời giải. Khi gặp các bài toán khó, mô hình tăng quy mô tính toán bằng cách tạo nhiều hướng giải song song và chọn kết quả có mức tin cậy cao nhất. Cách làm này giúp nâng chất lượng đáp án trong những tình huống đòi hỏi lập luận nhiều tầng.

Sự xuất hiện của DeepseekMath-V2 diễn ra trong bối cảnh OpenAI và Google DeepMind đang thử nghiệm các mô hình mới có khả năng đạt mức huy chương vàng tại IMO. Tuy nhiên, thông tin về những hệ thống này khá hạn chế. Một nhà nghiên cứu của OpenAI chỉ xác nhận rằng phiên bản mô hình toán mạnh hơn dự kiến sẽ xuất hiện trong vài tháng tới.

Khác với sự kín tiếng của các công ty Mỹ, Deepseek công bố chi tiết phương pháp và kiến trúc kỹ thuật. Việc làm này giúp hãng thể hiện mức độ minh bạch hiếm thấy trong lĩnh vực AI, đồng thời tạo sức ép cạnh tranh lên hệ sinh thái công nghệ Mỹ. The Economist ghi nhận một số startup tại Mỹ đã tính đến việc chuyển sang dùng mô hình nguồn mở giá rẻ từ Trung Quốc nhằm giảm chi phí vận hành.

Với DeepseekMath-V2, cuộc đua nâng năng lực suy luận của mô hình ngôn ngữ đang trở nên quyết liệt hơn. Các nhà nghiên cứu quốc tế dự đoán những công bố sắp tới từ các tập đoàn lớn có thể đánh dấu bước tiến mới trong khả năng giải quyết bài toán thực tế của AI.

Bình luận