Trong một cuộc đối đầu bí mật, AI đã chứng tỏ khả năng vượt trội khi giải quyết các bài toán phức tạp mà các nhà toán học tinh hoa gặp khó khăn. Thành công này không chỉ làm thay đổi cách nhìn về vai trò của trí tuệ nhân tạo trong lĩnh vực toán học mà còn đặt ra nhiều câu hỏi về tương lai của ngành. Liệu đây có phải là bước ngoặt mới cho cả AI và con người?
Những điểm chính
- Chatbot o4-mini của OpenAI vượt trội trong cuộc thi toán học tại Berkeley, đánh bại nhiều nhà toán học tinh hoa.
- o4-mini giải thành công 20% trong 300 câu hỏi toán hóc búa do Epoch AI đặt ra.
- LLM truyền thống chỉ giải được dưới 2%, cho thấy sự tiến bộ vượt bậc của AI mới.
- AI xử lý nhanh hơn con người, tạo ra bước đột phá trong giải quyết các vấn đề toán học phức tạp.
- Cuộc đối đầu thúc đẩy hợp tác và sáng tạo giữa nhà toán học và AI, mở ra tương lai mới cho toán học.
Một cuộc so tài toán học đầy kịch tính đã diễn ra tại Berkeley, California, khi 30 nhà toán học danh tiếng từ nhiều quốc gia, trong đó có Vương quốc Anh, đối đầu trực tiếp với chatbot reasoning o4-mini do OpenAI phát triển. Sự kiện này diễn ra trong một cuối tuần giữa tháng 5 năm 2025, với mục tiêu thử thách khả năng toán học của o4-mini qua những bài toán do chính các chuyên gia thiết kế. Chatbot này, dựa trên mô hình reasoning large language model (LLM), được đánh giá là nhẹ hơn, nhanh nhẹn hơn so với các LLM truyền thống, cho phép nó xử lý các vấn đề toán học phức tạp một cách sâu sắc.
Cuộc so tài toán học kịch tính giữa 30 nhà toán học và chatbot reasoning o4-mini tại Berkeley, 2025.
Kết quả benchmark cho thấy o4-mini đã giải được khoảng 20% trong số 300 câu hỏi toán học chưa được giải do Epoch AI xây dựng, trong khi các LLM truyền thống chỉ giải được dưới 2%. Điều này đã khiến các nhà toán học phải đặt ra những bài toán hóc búa hơn, cùng phần thưởng 7.500 USD cho mỗi câu hỏi mà AI không thể giải quyết. Không chỉ dừng lại ở đó, o4-mini còn gây ấn tượng khi giải thành công một câu hỏi mở ở trình độ Ph.D về lý thuyết số ngay trong thời gian thực, vượt trội hơn phần lớn nhà toán học con người tham gia.
Sự thành công của o4-mini không chỉ làm thay đổi cách nhìn về năng lực của trí tuệ nhân tạo trong lĩnh vực toán học mà còn đặt ra những câu hỏi về vai trò tương lai của các nhà toán học. Khi AI có thể xử lý những câu hỏi cấp độ cao, con người có thể chuyển trọng tâm sang phát triển các vấn đề mới, khai phá những lĩnh vực chưa được biết đến. Tuy nhiên, điều này cũng tạo nên những lo ngại về độ tin cậy của kết quả AI khi nó dựa vào việc hiểu sâu các tài liệu liên quan trước khi đưa ra lời giải.
Cuộc đối đầu bí mật tại Berkeley đã mở ra một trang mới trong sự hợp tác và cạnh tranh giữa con người và AI trong toán học, đồng thời nhấn mạnh tầm quan trọng của việc duy trì khả năng sáng tạo và tư duy phê phán trong giáo dục đại học để đối mặt với sự phát triển nhanh chóng của công nghệ.
Kết luận
Cuộc đối đầu bí mật giữa AI và các nhà toán học tinh hoa như một ngọn đèn pha chiếu sáng con đường mới trong lĩnh vực toán học, đồng thời cũng là tấm gương phản chiếu những thách thức và cơ hội mà công nghệ hiện đại mang lại. AI không chỉ mở rộng giới hạn nhận thức mà còn đặt ra câu hỏi về vai trò của trí tuệ con người trong tương lai. Sự hợp tác hài hòa giữa máy móc và con người chính là chìa khóa để khai phá những chân trời tri thức chưa từng có.