- Google DeepMind та OpenAI оголосили, що їхні моделі штучного інтелекту отримали золоті бали на Міжнародній математичній олімпіаді для учнів старших класів.
- Обидві моделі вирішували п'ять із шести проблем, використовуючи системи загального призначення, здатні міркувати природною мовою.
- Організація IMO офіційно сертифікувала результати Google, тоді як OpenAI був зовнішньо оцінений колишніми медалістами.
- Ця віха знаменує собою значний прогрес у використанні штучного інтелекту для складних математичних завдань, що має значення для наукових досліджень.
Ландшафт штучного інтелекту в академічних колах щойно зазнав значних змін після оголошення про те, що Моделі штучного інтелекту Google DeepMind та OpenAI досягли необхідного балу для золотої медалі на престижній Міжнародній математичній олімпіаді. (IMO). Це досягнення являє собою значний прогрес у здатності машин вирішувати математичні задачі на рівні найкращих учнів старших класів світу.
Обидві компанії, які вважаються лідерами в розробці передових систем штучного інтелекту, Вони оголосили, що їхні моделі пройшли п'ять із шести тестів у конкурсі., отримавши оцінку 35 балів із 42, що зазвичай гарантує «золоте» визнання на конкурсі. Цього результату було досягнуто за допомогою моделей загального призначення, які обробляють твердження за допомогою природної мови, таким чином відходячи від попередніх методів, заснованих на перекладі на формальні мови або систематичних обчисленнях.
Участь та перевірка в ІМО
Виставка IMO, в якій брали участь ці моделі, відбулася в Саншайн-Кост, Квінсленд (Австралія), і взяла участь понад 630 студентів зі 113 делегаційЗагалом золоту медаль вибороли 67 учасників змагань, що ставить досягнення штучного інтелекту в контекст високого попиту та конкуренції.
Валідацію результатів здійснив Тісна співпраця Google з оргкомітетом, яка офіційно сертифікувала ефективність свого штучного інтелекту та встановила процедури публікації даних після незалежної перевірки. Зі свого боку, OpenAI провела самооцінку, використовуючи трьох колишніх медалістів IMO для кваліфікації їхніх результатів за тими ж правилами, що й у учасників змагань.
Нові моделі та методи

Головна новизна цього видання полягає в тому, використання неформальні моделі міркувань, як-от Gemini Deep Think від Google, які обробляють та вирішують проблеми безпосередньо природною мовоюЦя здатність дозволяє ШІ паралельно аналізувати різні шляхи вирішення, вибираючи найбільш доцільну стратегію в час, подібний до часу студентів: 4,5 години на іспит без зовнішньої підтримки наприклад, калькулятори чи інтернет.
Google підкреслив, що його модель змогла чітко та детально відобразити міркування, водночас OpenAI підкреслив можливість одночасного виконання кількох напрямків мислення за допомогою інтенсивних обчислень, хоча вони визнали, що ці версії не будуть доступні для громадськості найближчим часом.
Дискусії та скептицизм щодо результатів
Хоча прогрес є незаперечним, Спосіб, яким OpenAI повідомляв про свої результати, викликав суперечки.Організація IMO попросила компанії-учасниці не розголошувати свої дані до церемонії огляду та нагородження, прохання, яке Google виконала, але OpenAI не дотримувалася його суворо.
Крім того, деякі експерти та члени комітету попереджали про відсутність прозорості стосовно використовуваних обчислювальних ресурсів та можливості втручання людини в деякі процесиОднак спільнота загалом приймає математичну обґрунтованість рішень, запропонованих штучним інтелектом.
Наслідки для майбутнього математичних досліджень

Прогрес, досягнутий моделями Google та OpenAI, підкріплює ідею про те, що Штучний інтелект може стати ключовим інструментом для вирішення невирішених проблем у математиці, а також в інших галузях, таких як фізика. Дослідники, такі як Джунхюк Юнг з Браунського університету, вважають, що ми близькі до тіснішої співпраці між математиками та системами штучного інтелекту, яка подолає значні наукові бар'єри, стимулюючи інновації в багатьох дисциплінах.
Окрім основних змагань, цього року IMO вручила приз Математичної олімпіади зі штучного інтелекту., вартістю 10 мільйонів доларів, спрямований на заохочення створення відкритих моделей штучного інтелекту для математики. Цю нагороду отримала команда Nvidia, що демонструє сильний інтерес технологічної спільноти до таких завдань та зростаючу професіоналізацію сектору.
Обмеження та майбутнє ШІ в математиці
Одним із найяскравіших моментів після змагань є велика різниця між дослідницькими моделями та тими, що доступні громадськостіХоча лабораторний штучний інтелект досяг вражаючих результатів, його версії з відкритим кодом ще навіть не отримали бронзової медалі в тестах IMO. Це викликає питання щодо масштабованості та демократизації цих технологій, а також ступеня зрілості сучасних бізнес-моделей порівняно з їхніми експериментальними аналогами.
Темпи прогресу штучного інтелекту в математиці помножили очікування щодо його здатності вирішувати історичні проблеми. Однак Як математична, так і технологічна спільноти рекомендують дотримуватися обережної позиції., забезпечуючи ретельну та прозору оцінку перед прийняттям остаточних результатів.
Найновіше видання Міжнародна математична олімпіада стала поворотним моментом для штучного інтелекту., що закріпило Google та OpenAI як лідерів у застосуванні передових моделей міркування. Хоча залишаються питання щодо методології та публічної доступності цих рішень, цей прорив вказує на багатообіцяючий шлях до дедалі тіснішої співпраці між людьми та машинами у вирішенні складних задач у математиці та інших наукових дисциплінах.
Я ентузіаст технологій, який перетворив свої "гікові" інтереси на професію. Я провів понад 10 років свого життя, користуючись передовими технологіями та возячись із усіма видами програм із чистої цікавості. Зараз я спеціалізуюся на комп’ютерних технологіях та відеоіграх. Це тому, що більше 5 років я писав для різних веб-сайтів про технології та відеоігри, створюючи статті, які прагнуть надати вам необхідну інформацію мовою, зрозумілою для всіх.
Якщо у вас є запитання, я знаю все, що стосується операційної системи Windows, а також Android для мобільних телефонів. І я зобов’язаний перед вами, я завжди готовий витратити кілька хвилин і допомогти вам вирішити будь-які запитання, які можуть виникнути в цьому світі Інтернету.

