Septembra 2024 je OpenAI predstavil Napredni glasovni način (Advanced voice mode) za uporabnike ChatGPT Plus in Team, kar je prineslo pomembno izboljšanje glasovne interakcije z umetno inteligenco. Ta funkcija omogoča bolj naravne in tekoče pogovore, saj lahko uporabniki kadarkoli prekinejo odgovore AI, podobno kot bi to storili v pogovoru z drugo osebo. Poleg tega novi glasovi prinašajo bolj človeški ton in večjo raznolikost v čustvenih odtenkih, kar pogovor naredi še bolj pristen.

Pametni telefon prikazuje funkcijo Advanced Voice Mode za glasovno interakcijo z AI.

Kaj prinaša Napredni glasovni način?

  • Naravna pogovorna izkušnja: Ena izmed ključnih prednosti Naprednega glasovnega načina je možnost prekinitve AI sredi odgovora. Tako lahko uporabniki takoj prilagodijo svoja vprašanja ali odzive glede na prejete informacije, kar omogoča bolj tekoče in dinamične interakcije.
  • Raznoliki glasovi: OpenAI je dodal pet novih glasov (Arbor, Maple, Sol, Spruce in Vale), kar skupaj prinaša devet različnih glasov. Vsak glas ima svoj edinstven slog, kar omogoča prilagoditev tonov glede na potrebe uporabnikov. Glasovi so zasnovani tako, da zvenijo bolj naravno in vključujejo različne emocionalne odtenke.
  • Pogovori v ozadju: Nova funkcionalnost omogoča nadaljevanje pogovorov v ozadju, medtem ko uporabljate druge aplikacije, ali celo, ko je telefon zaklenjen. To je izjemno koristno, če na primer med pogovorom z AI iščete informacije na spletu ali pišete zapiske.

Zakaj Napredni glasovni način ni na voljo v evropskih državah?

Čeprav je Napredni glasovni način dostopen uporabnikom ChatGPT Plus in Teams v mnogih državah, je trenutno v Evropski uniji ter v državah, kot so Islandija, Švica, Norveška in Lihtenštajn, še vedno nedosegljiv. Razlog za to naj bi bile stroge regulative, povezane z AI zakonodajo v EU. Ena ključnih ovir je, da lahko Napredni glasovni način zaznava čustva uporabnika prek njihovega tona glasu, kar je v nasprotju z določenimi členi prihajajočega AI zakona v EU, ki omejuje uporabo sistemov umetne inteligence za analizo čustev.
OpenAI ni izrecno potrdil, da je to razlog za zamudo, vendar so izpostavili, da določeni trgi zahtevajo dodatne zunanje preglede, preden lahko lansirajo nove funkcije. To pomeni, da bo funkcija dostopna šele, ko bo zagotovljeno, da je skladna z lokalno zakonodajo.
Trenutno imajo evropski uporabniki Enterprise in Edu verzij dostop do te funkcije, medtem ko se za Plus uporabnike rollout še pripravlja. OpenAI upa, da bo funkcijo kmalu razširil tudi na preostale uporabnike v Evropi.

Potencialni vplivi Naprednega glasovnega načina na prihodnje interakcije z umetno inteligenco

Napredni glasovni način odpira nove možnosti za interakcije med uporabniki in umetno inteligenco, saj ponuja bolj naravne in človeške pogovore. Ena ključnih prednosti tega načina je, da lahko prepozna čustvene odtenke v glasu uporabnikov, kar pomeni, da lahko AI boljše razume razpoloženje in ton pogovora. Ta funkcionalnost bi lahko pomembno vplivala na personalizacijo storitev in komunikacijo, saj bi lahko ChatGPT prilagodil svoje odzive glede na čustveno stanje uporabnika.
Izboljšana uporabniška izkušnja: S tem, ko lahko Napredni glasovni način prepozna uporabnikovo razpoloženje in omogoča prekinitev odgovora AI, se občutek umetne inteligence kot stroja počasi zmanjšuje. Uporabniki bodo lahko bolj naravno komunicirali z AI, kar bo pomembno izboljšalo interakcije v sektorjih, kot so zdravstvo, izobraževanje in podpora strankam.
Povratne informacije v realnem času: Poleg tega kot so funkcionalnosti zaznavanja čustev in prekinjanje odgovora, omogočajo bolj dinamične interakcije. To bi lahko koristilo v različnih aplikacijah, kjer je hiter in natančen odziv ključen, na primer pri asistentih za duševno zdravje, kjer bi AI lahko prepoznal, kdaj je uporabnik pod stresom ali v stiski.
Etična vprašanja in regulative: Vendar pa ta napredek prinaša tudi etične izzive, saj zaznavanje čustev in analiza glasu odpira vprašanja o zasebnosti in varnosti podatkov. Regulacije, kot je prihajajoči AI zakon v EU, so namenjene zaščiti pravic uporabnikov, da bi preprečile zlorabo teh tehnologij. Prav te regulative so deloma razlog za zamudo pri uvedbi Naprednega glasovnega načina v EU.
Priložnosti za prihodnost: Ko bo ta tehnologija v celoti razvita in usklajena z zakonodajnimi zahtevami, bi lahko postala ključna komponenta v razvoju večmodalnih asistentov, ki bodo lahko razumeli in interpretirali ne samo govor, ampak tudi vizualne in besedilne vsebine. Tako bi umetna inteligenca postala še bolj učinkovita in uporabna v vsakdanjem življenju.

Deli članek