- ОпенАИ је објавио нове аудио моделе засноване на ГПТ-4о и ГПТ-4о Мини ради побољшања транскрипције и конверзије говора.
- Ова побољшања имају за циљ да понуде већу прецизност, смањење грешака и боље прилагођавање различитим стиловима и акцентима.
- Гласовни агенти ће моћи да прилагоде своју интонацију, чинећи их лакшим за употребу у корисничкој служби и другим апликацијама.
- Лансирање сугерише будућност у којој ће АИ асистенти постати све природнији и изражајнији.

OpenAI је направио велики корак у развоју природнијих, изражајнијих и прецизнијих модела гласа, недавно је најавио нове верзије своје аудио технологије засноване на ГПТ-4о и ГПТ-4о Мини. Са овим ажурирањем, компанија настоји да олакша интеграцију гласовних агената у више апликација, са акцентом на персонализацију и унапређење квалитета интеракције.
Овај напредак одговара растућој потражњи за системима вештачке интелигенције који су ефикаснији у тумачењу језика и генерисању природног гласа, што отвара врата ери у којој Комуникација са аутоматизованим системима ће се практично не разликовати од разговора са људима.
Нови аудио модели: побољшања у транскрипцији и генерисању говора
The Нови ОпенАИ модели укључују ГПТ-4о-транскрипцију и ГПТ-4о-мини-транскрипцију за конверзију говора у текст, пружајући прецизнију транскрипцију, чак и у окружењима са позадинском буком или различитим акцентима. Захваљујући свом напредном учењу, ови модели значајно смањују стопу грешке у речима (ВЕР), побољшавајући прилагођавање различитим језицима и стиловима говора.
Поред тога, ОпенАИ је објавио ГПТ-4о-мини-ттс, модел за претварање текста у говор који омогућава вам да прилагодите интонацију, тон и стил говора. Ово је кључно за развој природнијих дигиталних асистената, способних да одговоре одговарајућом емоционалношћу у различитим контекстима, као што су корисничка услуга или нарација садржаја. У том контексту су такође направљени развоји који дозвољавају претварајте текст у говор у разним апликацијама.
Персонализација и практичне примене
Једна од највећих нових карактеристика је то Програмери ће моћи да прилагоде гласове кроз ове моделе, прилагођавајући детаље као што су брзина, интонација и експресивност. Ово отвара пут ка Прилагођено дизајнирани гласовни агенти за различите секторе, од виртуелних асистената до алата за приступачност за особе са оштећењем вида или слуха.
Компаније већ истражују употребу ових модела за оптимизовати корисничку услугу, стварајући системе који су способни да управљају позивима и течније одговарају у позивним центрима. Планирана је и његова интеграција у образовне апликације, платформе за забаву и алате за продуктивност.
Технологија обуке и побољшања тачности
Да би постигао ова побољшања, ОпенАИ је користио обуку засновану на стварне аудио податке и напредне технике учења поткрепљења. Ово је омогућило моделима да боље разумеју нијансе језика, прилагоде одговоре различитим типовима корисника и понуде природније искуство разговора.
Нови модел надмашује свог претходника, Вхиспер, у више аспеката, укључујући способност тумачења пауза у разговору без ометања корисника и смањења грешака у транскрипцији у реалном времену. А уз све то примењују се и приступи препознавање гласа у разним областима.
Утицај на будућност конверзацијске вештачке интелигенције
Издавање ових модела сугерише трансформацију у начину на који комуницирамо са помоћницима вештачке интелигенције. Могућност поседовања Саосећајнији и прецизнији гласовни агенти могли би да револуционишу секторе као што су е-трговина, здравство и образовање.. Важно је размотрити како напредује оваква може бити у вези са стварањем нових аудио уређаја који побољшавају целокупно корисничко искуство.
Како се ове технологије развијају, линија између људи и вештачке интелигенције постаје све нејаснија. Са оваквим развојем, ОпенАИ се позиционира на чело стварања природнијег конверзацијског искуства., приближавајући нас ери у којој ће се комуникација са вештачком интелигенцијом практично не разликовати од интеракције између људи.
Ја сам технолошки ентузијаста који је своја „штреберска“ интересовања претворио у професију. Провео сам више од 10 година свог живота користећи најсавременију технологију и петљајући по свим врстама програма из чисте радозналости. Сада сам се специјализовао за компјутерску технологију и видео игрице. То је зато што више од 5 година пишем за различите веб странице о технологији и видео игрицама, стварајући чланке који желе да вам дају информације које су вам потребне на језику који је свима разумљив.
Ако имате било каквих питања, моје знање се креће од свега што се тиче Виндовс оперативног система као и Андроида за мобилне телефоне. И моја посвећеност је вама, увек сам спреман да потрошим неколико минута и помогнем вам да решите сва питања која имате у овом свету интернета.
