Novi alati omogućuju razgovor, transkripciju i prijevod u stvarnom vremenu, a temelje se na naprednom GPT-5 razmišljanju.
OpenAI je najavio da će njegov API od sada uključivati niz novih glasovnih značajki osmišljenih kako bi programerima pomogle u stvaranju aplikacija koje mogu razgovarati i prevoditi razgovore s korisnicima. Tvrtka je predstavila nekoliko novih modela, uključujući GPT-Realtime-2, GPT-Realtime-Translate i GPT-Realtime-Whisper, koji donose napredne mogućnosti obrade govora.
OpenAI je u četvrtak priopćio kako njegov API sada uključuje nekoliko novih glasovnih značajki namijenjenih razvoju aplikacija koje mogu voditi razgovore, transkribirati i prevoditi interakcije s korisnicima.
Novi model GPT-Realtime-2 predstavlja naprednu glasovnu simulaciju koja može komunicirati s korisnicima. Za razliku od prethodnika (GPT-Realtime-1.5), ovaj model koristi GPT-5 klasu razmišljanja, što mu omogućuje rješavanje složenijih korisničkih zahtjeva.
Tvrtka također lansira GPT-Realtime-Translate, koji pruža usluge prijevoda u stvarnom vremenu i prati korisnika tijekom razgovora. Značajka podržava više od 70 ulaznih jezika (koje model razumije) i 13 izlaznih jezika (koje prenosi sugovorniku).
Konačno, OpenAI je predstavio i novu mogućnost transkripcije pod nazivom GPT-Realtime-Whisper, koja korisnicima omogućuje pretvaranje govora u tekst u stvarnom vremenu, dok se interakcije odvijaju.
„Zajedno, modeli koje lansiramo pomiču stvarnovremenski audio od jednostavnog poziva i odgovora prema glasovnim sučeljima koja zapravo mogu raditi: slušati, razmišljati, prevoditi, transkribirati i djelovati kako se razgovor odvija,” izjavila je tvrtka.
Kome su ta poboljšanja namijenjena? Očita ciljna skupina su tvrtke koje žele proširiti mogućnosti korisničke podrške. Međutim, OpenAI napominje da će nove značajke pomoći i u područjima poput obrazovanja, medija, događanja i platformi za kreatore sadržaja.
Iako alati izgledaju korisno iz poslovne perspektive, postoji mogućnost njihove zlouporabe. OpenAI je izjavio da je ugradio zaštitne mjere kako bi spriječio korištenje novih značajki za stvaranje neželjene pošte, prijevare ili drugih oblika online zlostavljanja. U sustav su ugrađeni određeni okidači tako da se „razgovori mogu zaustaviti ako se otkrije da krše naše smjernice o štetnom sadržaju,” navodi OpenAI.
Svi novi glasovni modeli uključeni su u OpenAI-jev Realtime API. Usluge Translate i Whisper naplaćuju se po minuti, dok se GPT-Realtime-2 naplaćuje prema potrošnji tokena.

U Indiji radnici na trakama za sklapanje električkih uređaja dobivaju 10 dolara zato što nose kamare na glavi. Kamera snima tog radnika kako sklapa komponente, snimke se onda prodaju firmama koje razvijaju umetnu inteligenciju da bi roboti naučili kako raditi posao koji sada rade indiciji. Znači za par godina svu proizvodnju će preuzeti roboti to će biti kraj poslova u proizvodnji za milijune ljudi.
Na stolu se već kavica pari
i ko za komente da mari.
A l…………………………..i
** . ** . ** . ** . ** . ** .
“Džaba im GPT i te glasovne trake,
kad ne znaju za Sunce i te zrake lake!
Dok se on u ‘petici’ s kodom nešto pati,
mene prava frekvencija u srce dohvati.
** . ** . **
Mijenja mi vibraciju, nije od čelika,
to je snaga prirode, čista i velika!
Nek’ on prevodi i nek’ u nule piše,
moje srce kuca prirodno – i suncem diše!
A adminu što nas validacijom davi,
nek’ GPT-5 malo red u glavi napravi.
Dok on lupa kvačice i traži nam mane,
nama Sunce grije srce i slobodne dane!”
** . ** . ** . ** . ** . ** .