OpenAI predstavlja napredno pretvorbo besedila v govor – na voljo tudi v slovenščini : Portal100.si

Narejeno z umetno inteligenco

Podjetje OpenAI je razvilo novo storitev za pretvorbo besedila v govor (Text to Speech oziroma TTS), ki s pomočjo naprednega modela gpt-4o-mini-tts omogoča naravno in tekoče generiranje govora v več jezikih, vključno s slovenščino.

Mikrofon pred knjigo z besedilom, ki ponazarja pretvorbo besedila v govor z umetno inteligenco
(Foto: UI)

Nova rešitev omogoča naslednje funkcionalnosti:

Enajst različnih glasov, vsak s svojim značajem (npr. toplejši, bolj resni, mladostniški ipd.)
Prilagajanje tona, hitrosti govora, čustev, naglasa, pa tudi možnost šepeta ali imitacije
Podpora različnim formatom zvočnih datotek: MP3 (privzeti), WAV, Opus, AAC, FLAC, PCM
Generiranje zvoka v realnem času (t. i. streaming) – omogoča, da se govor predvaja sproti, še preden je celotna datoteka ustvarjena
Večjezična podpora, med katerimi je tudi slovenščina, ki jo sistem interpretira tekoče in razumljivo

Zaradi možnosti streamanja je tehnologija še posebej primerna za aplikacije, kjer je pomembna hitra povratna zvočna informacija – na primer v virtualnih asistentih, interaktivnih sistemih in spletnih vsebinah.

Na spletni strani Portal100.si že potekajo prve integracije te tehnologije. Pri določenih člankih bo na voljo tudi govorna različica vsebine, ustvarjena z umetno inteligenco. Prav ta članek je eden izmed prvih, kjer je objavljen tudi avdio posnetek, ustvarjen z modelom gpt-4o-mini-tts.

Zaradi zahtev uporabe te tehnologije je pomembno, da uporabnike jasno obvestimo, da gre za računalniško generiran glas, ne za človeško govorno interpretacijo.

Vabljeni k poslušanju in preizkusu funkcionalnosti.

Ne zamudite novosti, naročite se na naše e‑novice