OpenAI запускае o3 і o3 Mini: новыя мадэлі для перадавых разваг у галіне штучнага інтэлекту

Апошняе абнаўленне: 23/12/2024

o3 і o3 міні-2

OpenAI, піянерская кампанія ў галіне штучнага інтэлекту, абвясціла аб сваёй апошняй дасягненні: мадэлі o3 і o3 Mini. Гэтыя новыя рашэнні, распрацаваныя спецыяльна для вырашэння задач, якія патрабуюць глыбокага разумення, абяцаюць значны скачок у параўнанні з папярэднім пакаленнем мадэляў, такіх як o1. Хоць яны яшчэ недаступныя для шырокай публікі, яны ўжо выклікаюць ажыятаж у тэхналагічнай супольнасці.

З моманту свайго першапачатковага выпуску мадэлі разважанняў зарэкамендавалі сябе як ключавыя інструменты ў праграмах, якія патрабуюць дакладнасці і дэталёвага аналізу. З дапамогай o3 і o3 Mini OpenAI імкнецца ўмацаваць сваё лідэрства ў сектары, прадстаўляючы значныя паляпшэнні як у прадукцыйнасці, так і ў гнуткасці выкарыстання.

Асаблівасці новых мадэляў

OpenAI o3 у дзеянні

Адным з асноўных момантаў o3 з'яўляецца яго здольнасць вырашаць складаныя праблемы, разбіваючы іх на больш дробныя этапы. Гэты працэс, вядомы як «ланцужок думак», дазваляе мадэлі аналізаваць кожны этап, перш чым даць канчатковы адказ. Гэта гарантуе не толькі большую дакладнасць, але і падрабязнае тлумачэнне вашых разважанняў, што для вас неацэнна такія сектары, як адукацыя, перадавое праграмаванне і навуковы аналіз.

Эксклюзіўны кантэнт - націсніце тут  Як выправіць памылку DeepSeek API 422

Выпрабаванні, праведзеныя да гэтага часу, далі ўражлівыя вынікі. Напрыклад, у бенчмарке Праверана SWE-Bench, o3 дасягнуў павелічэння на 22,8% у параўнанні са сваім папярэднікам o1, дасягнуўшы ўзроўню дакладнасці 84,9%. У іншым прыкметным тэсце, the Амерыканскі запрашальны экзамен па матэматыцы 2024, o3 атрымаў 96,7%, не задаўшы толькі адно пытанне.

Акрамя таго, o3 Mini, аптымізаваная і палегчаная версія, распрацавана для спецыяльных прыкладанняў і прылад з меншай вылічальнай магутнасцю. Абедзве мадэлі карыстаюцца унікальнай асаблівасцю: карыстальнікі могуць наладжваць "час разважанняў" паміж нізкім, сярэднім і высокім. Гэта дазваляе вызначаць прыярытэты хуткасці або дакладнасці ў залежнасці ад кантэксту, што з'яўляецца значным прагрэсам у параўнанні з папярэднімі мадэлямі.

Стратэгічны крок да штучнага агульнага інтэлекту

Тэст прадукцыйнасці ў OpenAI

OpenAI не пакінуў без увагі важнасць брэнда і яго ўплыў на рынак. Па словах кампаніі, яны вырашылі прапусціць назву «o2», каб пазбегнуць магчымых юрыдычных канфліктаў з брытанскай тэлекамунікацыйнай кампаніяй O2. Гэты рух, хоць і цікавы, адлюстроўвае ўвагу да дэталяў фірмы пад кіраўніцтвам Сэма Альтмана.

Эксклюзіўны кантэнт - націсніце тут  Італія забараняе DeepSeek з-за праблем з заканадаўствам аб прыватнасці і даных

Акрамя тэхнічных удасканаленняў, новыя мадэлі таксама ўяўляюць сабой важны крок на шляху да гэтага штучны агульны інтэлект (AGI). У тэстах як АРК-АГІ, прызначаны для вымярэння чалавечых кагнітыўных здольнасцей, o3 атрымаў адзнаку 87,5%, значна пераўзыходзячы сваіх папярэднікаў.

Даступнасць і ранні доступ

Даступнасць OpenAI o3

Хоць мадэлі яшчэ не гатовыя да публічнага выпуску, OpenAI адкрыла спіс чакання для даследчыкаў бяспекі, зацікаўленых у тэставанні o3 Mini. Гэтая мадэль будзе даступная ў пачатку 2025 года, а пазней у тым жа годзе - o3. Кампанія абяцае, што абодва будуць даступныя па падпісцы, хоць канкрэтныя дэталі пакуль не раскрываюцца.

Такі паступовы падыход дазваляе OpenAI праводзіць шырокае тэсціраванне для забеспячэння бяспекі і эфектыўнасці мадэляў, што з'яўляецца фундаментальным аспектам у распрацоўцы прасунутага штучнага інтэлекту.

Канкурэнтны рынак: OpenAI супраць Google

Канкурэнцыя паміж OpenAI і Google

Запуск мадэляў o3 і o3 Mini адбываецца ў перыяд інтэнсіўнай канкурэнцыі ў сектары штучнага інтэлекту. Google, са свайго боку, нядаўна запусціў свой «Рэжым мыслення» ў Gemini 2.0 Flash, тэхналогію, якая таксама імкнецца палепшыць лагічныя развагі ў мадэлях штучнага інтэлекту. Аднак OpenAI, здаецца, схіляецца да больш паступовага і арыентаванага на спецыялізацыю падыходу, у адрозненне ад больш універсальнай мадэлі канкурэнта.

Эксклюзіўны кантэнт - націсніце тут  Як выкарыстоўваць Gemini у Gmail

Абедзве кампаніі рассоўваюць межы таго, што магчыма ў сферы штучнага інтэлекту, даючы зразумець, што будучыня гэтай сферы будзе залежаць як ад тэхнічных дасягненняў, так і ад стратэгій укаранення.

Мадэлі o3 і o3 Mini ўяўляюць сабой значны прагрэс у пошуку больш дакладнага, надзейнага і спецыялізаванага штучнага інтэлекту. Яго здольнасць вырашаць складаныя праблемы са структураванай логікай адкрывае новыя магчымасці для навуковых, прафесійных і адукацыйных прыкладанняў, адзначаючы да і пасля ў развіцці перадавых тэхналогій развагі.