- GoogleDeepMind和OpenAI宣布,他們的人工智慧模型在國際高中數學奧林匹克競賽中獲得金牌。
- 這兩種模型都利用能夠用自然語言推理的通用系統解決了六個問題中的五個。
- IMO 組織對Google的成績進行了官方認證,而 OpenAI 則由往屆獎牌得主進行了外部評估。
- 這一里程碑標誌著人工智慧在複雜數學推理任務中的應用取得了重大進步,對科學研究具有重要意義。
學術界的人工智慧格局剛剛發生了重大變化,因為 Google DeepMind 和 OpenAI 人工智慧模型在著名的國際數學奧林匹克競賽中取得了獲得金牌所需的分數。 (IMO)。這項成就代表著機器解決數學問題的能力取得了顯著進步,達到了世界最優秀高中生的水平。
這兩家公司都被視為先進人工智慧系統開發的領導者, 他們宣布,他們的模型通過了比賽六項測試中的五項。,獲得了35分(滿分42分),這通常意味著在比賽中能夠獲得「金牌」認可。這一結果是使用通用模型實現的,這些模型使用自然語言處理語句,從而擺脫了以往基於形式語言翻譯或系統計算的方法。
參與和驗證國際海事組織
這些模型參加的 IMO 比賽在澳洲昆士蘭州陽光海岸舉行,參賽人數超過 來自630個代表團的113名學生共有 67 名人類選手獲得金牌,這一數字表明人工智慧的成就是在高需求和高競爭的背景下取得的。
結果驗證由 Google 與組委會的密切合作,該公司正式認證了其人工智慧的性能,並建立了經過獨立審查後發布數據的程序。就其本身而言, OpenAI 進行了自我評估,使用三名前 IMO 獎牌得主按照與參賽者相同的規則來評估他們的成績。
新模型和方法

此版本的主要創新之處在於 使用 非正式推理模型就像谷歌的 Gemini Deep Think 一樣, 直接用自然語言處理解決問題. 這種能力 允許AI並行分析不同的解決方案路徑,在與學生相似的時間內選擇最適合的策略: 每次考試 4,5 小時(無需外部支援) 例如計算機或互聯網.
谷歌強調,其模型能夠以清晰、詳細的方式執行推理,同時 OpenAI 強調了透過密集運算同時進行多種思路的可能性,儘管他們承認這些版本短期內不會向公眾開放。
對結果的爭論和懷疑
雖然進步是不可否認的,但 OpenAI 傳達其結果的方式引發了爭議IMO組織要求參賽公司在評審和頒獎典禮之前不要透露自己的數據,Google尊重了這項要求,但OpenAI並沒有嚴格遵守。
此外,一些專家和委員會成員警告稱 缺乏透明度 關於所使用的計算資源以及某些過程中人為幹預的可能性然而,社會普遍接受人工智慧提出的解決方案的數學有效性。
數學研究未來的啟示

Google 和 OpenAI 模式所取得的進展強化了以下觀點: 人工智慧可以成為關鍵工具 解決數學以及物理等其他領域的未解難題。布朗大學的Junehyuk Jung等研究人員相信,我們即將實現數學家與人工智慧系統之間的更緊密合作,這將克服重大的科學障礙,推動跨學科的創新。
除主賽外,今年國際數學奧林匹克競賽也設立了人工智慧數學奧林匹克獎。,價值10萬美元,旨在鼓勵創建開放的數學AI模型。該獎項授予了來自英偉達的一個團隊,彰顯了科技界對此類挑戰的濃厚興趣,以及該領域日益專業化的進程。
人工智慧在數學領域的限制與未來
比賽結束後的亮點之一是 研究模型與公眾可訪問的模型之間存在巨大差異儘管實驗室人工智慧取得了令人矚目的成果,但其開源版本在國際海事組織(IMO)測試中甚至連銅牌都未曾獲得。這引發了人們對這些技術的可擴展性和民主化程度的質疑,以及與實驗性技術相比,當前商業模式的成熟度。
人工智慧在數學領域的進步速度,使其解決歷史性挑戰的能力倍增。然而, 數學界和技術界都建議保持謹慎的立場。,確保在接受最終結果之前進行嚴格、透明的評估。
最新版本的 國際數學奧林匹克競賽標誌著人工智慧的一個轉捩點。鞏固了Google和OpenAI在高階推理模型應用領域的領先地位。儘管這些解決方案的方法論和公開可用性仍存在疑問,但這一突破表明,在解決數學和其他科學學科的複雜問題方面,人機之間將有一條更加緊密的合作之路。
我是一名技術愛好者,已將自己的“極客”興趣變成了職業。出於純粹的好奇心,我花了 10 多年的時間使用尖端技術並修改各種程序。現在我專攻電腦技術和電玩遊戲。這是因為五年多來,我一直在為各種技術和視頻遊戲網站撰寫文章,力求以每個人都能理解的語言為您提供所需的資訊。
如果您有任何疑問,我的知識範圍涵蓋與 Windows 作業系統以及手機 Android 相關的所有內容。我對您的承諾是,我總是願意花幾分鐘幫助您解決在這個網路世界中可能遇到的任何問題。

