- Google DeepMindとOpenAIは、彼らの人工知能モデルが高校生を対象とした国際数学オリンピックで金賞を獲得したと発表した。
- どちらのモデルも、自然言語で推論できる汎用システムを使用して、6 つの問題のうち 5 つを解決しました。
- IMO組織はGoogleの成果を公式に認定し、OpenAIは元メダリストらによる外部評価を受けた。
- この画期的な出来事は、複雑な数学的推論タスクにおける AI の利用における大きな進歩を示すものであり、科学研究に大きな影響を与えます。
学術界における人工知能の状況は、次の発表を受けて大きな変化を遂げた。 Google DeepMind と OpenAI の AI モデルが、権威ある国際数学オリンピックで金メダルに必要なスコアを達成しました。 (IMO)。この成果は、世界トップクラスの高校生レベルの数学の問題を機械が解く能力において、大きな進歩を遂げたことを示しています。
両社は高度なAIシステム開発のリーダーとみなされており、 彼らは、彼らのモデルがコンテストの6つのテストのうち5つに合格したと発表した。35点満点中42点を獲得し、通常はコンテストで「ゴールド」認定が保証されるスコアを獲得しました。この結果は、自然言語による文を処理する汎用モデルを用いて達成されたもので、形式言語への翻訳や体系的な計算に基づく従来の手法から脱却しました。
IMOへの参加と検証
これらのモデルが参加したIMO版は、クイーンズランド州サンシャインコースト(オーストラリア)で開催され、 630の代表団から113人の学生合計67人の人間の競技者が金メダルを獲得したが、この数字は、高い需要と競争の状況の中でAIの偉業が達成されたことを物語っている。
結果の検証は、 Googleと組織委員会の緊密な協力は、AIの性能を公式に認証し、独立した審査を経てデータを公開する手順を確立しました。 OpenAIは自己評価を実施した元IMOメダリスト3名を出場者と同じルールで予選に出場させました。
新しいモデルと方法

この版の主な新しさは、 の使用 非公式推論モデルGoogleのGemini Deep Thinkのように、 自然言語で直接問題を処理して解決するこの能力 AIがさまざまな解決策のパスを並行して分析できるようにする学生と同様の時間内に最も適切な戦略を選択する: 外部サポートなしの試験4,5回あたりXNUMX時間 電卓やインターネットなど.
Googleは、そのモデルが明確かつ詳細な方法で推論を実行できることを強調したが、 OpenAIは、集中的なコンピューティングを通じて複数の思考を同時に実行できる可能性を強調した。ただし、これらのバージョンは短期的には一般に公開されないことは認めた。
結果についての議論と懐疑論
進歩は否定できないが、 OpenAIが結果を伝える方法は論争を巻き起こしたIMO組織は参加企業に対し、審査と授賞式の前にデータを公開しないよう要請し、Googleはその要請を尊重したが、OpenAIは厳密には従わなかった。
さらに、一部の専門家や委員会メンバーは、 透明性の欠如 使用される計算リソースと一部のプロセスにおける人間の介入の可能性に関連してしかし、コミュニティは一般的に、AI によって提示されたソリューションの数学的妥当性を受け入れています。
数学研究の将来への示唆

GoogleとOpenAIのモデルが達成した進歩は、 人工知能は重要なツールとなり得る 数学だけでなく、物理学などの他の分野における未解決の問題にも取り組む必要があります。ブラウン大学のジュンヒョク・ユン氏をはじめとする研究者は、数学者とAIシステムのより緊密な連携が間近に迫っており、科学における大きな障壁を克服し、複数の分野にまたがるイノベーションを推進すると考えています。
IMO は、メインのコンテストに加えて、今年は AI 数学オリンピック賞も授与しました。数学分野におけるオープンAIモデルの開発を促進することを目的とした、総額10万ドルのAI研究助成金。この賞はNVIDIAのチームに授与され、テクノロジーコミュニティがこの種の課題に強い関心を示し、この分野の専門化が進んでいることを示しました。
数学におけるAIの限界と将来
大会後のハイライトの一つは 研究モデルと一般公開されているモデルの間には大きな違いがある実験室レベルのAIは目覚ましい成果を上げているものの、オープンソース版はIMOのテストで銅メダルすら獲得できていません。これは、これらの技術の拡張性と民主化、そして実験段階のAIと比較した現在のビジネスモデルの成熟度について疑問を投げかけています。
数学分野におけるAIの進歩のスピードは、歴史的な課題を解決する能力に対する期待を倍増させています。しかしながら、 数学界と技術界はどちらも慎重な姿勢を維持することを推奨しています。最終結果を受け入れる前に厳格かつ透明性のある評価を保証します。
最新版の 国際数学オリンピックは人工知能にとって転換点となった。これにより、GoogleとOpenAIは高度な推論モデルの応用におけるリーダーとしての地位を確固たるものにしました。これらのソリューションの方法論や公開性については依然として疑問が残りますが、この画期的な進歩は、数学やその他の科学分野における複雑な問題の解決において、人間と機械のより緊密な連携に向けた有望な道筋を示しています。
私はテクノロジー愛好家であり、その「オタク」の興味を職業に変えています。私は 10 年以上、純粋な好奇心から最先端のテクノロジーを使用し、あらゆる種類のプログラムをいじくり回してきました。現在はコンピューター技術とビデオゲームを専門にしています。これは、私が 5 年以上、テクノロジーやビデオ ゲームに関するさまざまな Web サイトに執筆し、誰にでも理解できる言語で必要な情報を提供することを目的とした記事を作成しているためです。
ご質問がございましたら、私の知識は Windows オペレーティング システムから携帯電話用の Android に関連するあらゆるものまで多岐にわたります。そして、私はあなたに対して、いつでも喜んで数分を費やして、このインターネットの世界であなたが抱いている疑問を解決するお手伝いをしたいと考えています。

