Google và OpenAI: Huy chương vàng tại kỳ thi Olympic Toán AI

Google DeepMind và OpenAI vừa công bố các mô hình trí tuệ nhân tạo của họ đã đạt điểm vàng trong kỳ thi Olympic Toán học quốc tế dành cho học sinh trung học.
Cả hai mô hình đều giải quyết được năm trong số sáu vấn đề, sử dụng các hệ thống đa năng có khả năng suy luận bằng ngôn ngữ tự nhiên.
Tổ chức IMO chính thức chứng nhận kết quả của Google, trong khi OpenAI được các cựu vận động viên đoạt huy chương đánh giá bên ngoài.
Cột mốc này đánh dấu bước tiến đáng kể trong việc sử dụng AI cho các nhiệm vụ suy luận toán học phức tạp, có ý nghĩa đối với nghiên cứu khoa học.

Google và OpenAI giành huy chương vàng tại Kỳ thi Olympic Toán học AI quốc tế

Bối cảnh của trí tuệ nhân tạo trong học viện vừa trải qua một sự thay đổi đáng kể sau thông báo rằng Các mô hình AI của Google DeepMind và OpenAI đã đạt được số điểm cần thiết để giành huy chương vàng tại Kỳ thi Olympic Toán học quốc tế danh giá. (Theo tôi). Thành tựu này đánh dấu bước tiến đáng kể về khả năng của máy móc trong việc giải quyết các bài toán ở trình độ của những học sinh trung học giỏi nhất thế giới.

Cả hai công ty đều được coi là những công ty đi đầu trong việc phát triển các hệ thống AI tiên tiến, Họ đã công bố rằng mô hình của họ đã vượt qua 5 trong số 6 bài kiểm tra trong cuộc thi., đạt 35/42 điểm, thường đảm bảo sự công nhận "vàng" trong cuộc thi. Kết quả này đạt được nhờ sử dụng các mô hình đa năng xử lý các câu lệnh bằng ngôn ngữ tự nhiên, do đó tránh xa các phương pháp trước đây dựa trên việc dịch sang ngôn ngữ hình thức hoặc tính toán hệ thống.

Tham gia và xác minh trong IMO

Phiên bản IMO mà các mô hình này tham gia được tổ chức tại Sunshine Coast, Queensland (Úc), với hơn 630 sinh viên từ 113 đoàn đại biểuTổng cộng có 67 vận động viên là con người đã giành được huy chương vàng, một con số cho thấy thành tích của AI diễn ra trong bối cảnh nhu cầu và tính cạnh tranh cao.

Nội dung độc quyền - Bấm vào đây Đây là pin dự phòng đầu tiên của Elecom sử dụng pin natri: Mạnh mẽ hơn và bền vững hơn

Việc xác nhận kết quả được thực hiện bởi Sự hợp tác chặt chẽ của Google với ban tổ chức, chính thức chứng nhận hiệu suất AI của mình và thiết lập các quy trình công bố dữ liệu sau khi đánh giá độc lập. Về phần mình, OpenAI đã tiến hành tự đánh giá, sử dụng ba cựu vận động viên đoạt huy chương IMO để đánh giá kết quả của họ theo cùng các quy tắc như đối thủ cạnh tranh.

Các mô hình và phương pháp mới

các mô hình mới của AI lý luận phi chính thức

Sự mới lạ chính của phiên bản này nằm ở sử dụng mô hình lý luận không chính thức, giống như Gemini Deep Think của Google, xử lý và giải quyết vấn đề trực tiếp bằng ngôn ngữ tự nhiên. Khả năng này cho phép AI phân tích các đường dẫn giải pháp khác nhau song song, lựa chọn chiến lược phù hợp nhất trong thời gian tương tự như thời gian của học sinh: 4,5 giờ cho mỗi kỳ thi mà không cần hỗ trợ bên ngoài chẳng hạn như máy tính hoặc internet.

Google nhấn mạnh rằng mô hình của họ có thể thực hiện lý luận một cách rõ ràng và chi tiết, trong khi OpenAI nhấn mạnh khả năng thực hiện nhiều dòng suy nghĩ cùng lúc thông qua tính toán chuyên sâu, mặc dù họ thừa nhận rằng những phiên bản này sẽ không được công bố rộng rãi trong thời gian ngắn.

Nội dung độc quyền - Bấm vào đây Ai-Da, nghệ sĩ robot thách thức nghệ thuật của con người với bức chân dung Vua Charles III

Tranh luận và hoài nghi về kết quả

Mặc dù sự tiến bộ là không thể phủ nhận, Cách OpenAI truyền đạt kết quả của mình đã gây ra nhiều tranh cãiTổ chức IMO đã yêu cầu các công ty tham gia không tiết lộ dữ liệu của họ trước lễ đánh giá và trao giải, một yêu cầu mà Google đã tôn trọng, nhưng OpenAI đã không tuân thủ nghiêm ngặt.

Ngoài ra, một số chuyên gia và thành viên ủy ban đã cảnh báo về thiếu minh bạch liên quan đến các nguồn tài nguyên tính toán được sử dụng và khả năng can thiệp của con người vào một số quy trìnhTuy nhiên, cộng đồng nhìn chung chấp nhận tính hợp lệ về mặt toán học của các giải pháp do AI đưa ra.

Hướng dẫn AI dành cho học sinh: cách sử dụng mà không bị buộc tội sao chép

Ý nghĩa đối với tương lai của nghiên cứu toán học

Toán học AI mở

Tiến bộ đạt được của các mô hình Google và OpenAI củng cố ý tưởng rằng Trí tuệ nhân tạo có thể trở thành một công cụ quan trọng để giải quyết những vấn đề chưa được giải quyết trong toán học, cũng như trong các lĩnh vực khác như vật lý. Các nhà nghiên cứu như Junehyuk Jung của Đại học Brown tin rằng chúng ta đang tiến gần đến một sự hợp tác chặt chẽ hơn giữa các nhà toán học và hệ thống AI, qua đó vượt qua những rào cản khoa học đáng kể, thúc đẩy đổi mới trên nhiều lĩnh vực.

Bên cạnh cuộc thi chính, IMO còn trao Giải thưởng Olympic Toán học AI năm nay., trị giá 10 triệu đô la, nhằm mục đích khuyến khích việc tạo ra các mô hình AI mở cho toán học. Giải thưởng này đã được trao cho một nhóm từ Nvidia, thể hiện sự quan tâm mạnh mẽ của cộng đồng công nghệ đối với những thách thức kiểu này và sự chuyên nghiệp hóa ngày càng tăng của lĩnh vực này.

Nội dung độc quyền - Bấm vào đây Cách cải thiện kỹ năng và tối ưu hóa mã của bạn với GPT-5 Codex

Những hạn chế và tương lai của AI trong toán học

Một trong những điểm nổi bật sau cuộc thi là sự khác biệt lớn giữa các mô hình nghiên cứu và các mô hình công khaiMặc dù AI trong phòng thí nghiệm đã đạt được những kết quả ấn tượng, nhưng các phiên bản nguồn mở của nó vẫn chưa đạt được huy chương đồng trong các bài kiểm tra IMO. Điều này đặt ra câu hỏi về khả năng mở rộng và dân chủ hóa của các công nghệ này, cũng như mức độ hoàn thiện của các mô hình kinh doanh hiện tại so với các mô hình thử nghiệm tương ứng.

Tốc độ tiến bộ của AI trong toán học đã làm tăng thêm kỳ vọng về khả năng giải quyết các thách thức lịch sử của nó. Tuy nhiên, Cả cộng đồng toán học và công nghệ đều khuyến cáo nên duy trì lập trường thận trọng., đảm bảo đánh giá nghiêm ngặt và minh bạch trước khi chấp nhận kết quả cuối cùng.

Phiên bản mới nhất của Kỳ thi Olympic Toán học quốc tế đã đánh dấu bước ngoặt cho trí tuệ nhân tạo., củng cố vị thế dẫn đầu của Google và OpenAI trong việc ứng dụng các mô hình suy luận tiên tiến. Mặc dù vẫn còn nhiều nghi vấn về phương pháp luận và tính khả dụng của các giải pháp này, bước đột phá này cho thấy một con đường đầy hứa hẹn hướng tới sự hợp tác ngày càng chặt chẽ hơn giữa con người và máy móc trong việc giải quyết các vấn đề phức tạp trong toán học và các ngành khoa học khác.