Mesterséges intelligencia reprodukálja egy rádiós hangját

Az 54 éves Jamie Dupree, a Cox Media riportere 35 éven át politikai tudósításokat készített az Egyesült Államok Kongresszusából. 2016-ban kezdte elveszíteni a hangját, bár hangszálai, torka és gégéje rendben voltak. Hosszas vizsgálatok után megállapították, hogy ritka idegrendszeri zavar miatt a nyelve előreesik a szájüregbe és a torka megfeszül, valahányszor meg akar szólalni, így képtelen egyszerre két-három szónál többet kimondani. A riporter mégsem hagyta abba a munkát, interjúkat írt, de az éterből lényegében eltűnt a hangja.

A Cox media a skót CereProc technológiai céghez fordult segítségért. A cég 2006 óta olyan mesterséges intelligenciát fejleszt, amely képes hangfelvételek alapján egy személy hangját reprodukálni, és ezután ezen a hangon felolvasni egy szöveget.

Egy ember beszédhangjának reprodukálása rendkívül bonyolult folyamat, általában harmincórás felolvasásra van szükség, ez alatt tud a mesterséges intelligencia elég adatot gyűjteni. A mesterséges intelligenciáknak eddig egy hónap kellett ahhoz, hogy egy ember hangját reprodukálják, a módszer nagyon drága is volt.

A CereProc 2006-ban kezdte kidolgozni saját ideghálózatát, hogy a folyamatot felgyorsítsa és olcsóbbá tegye. Ma ez néhány nap alatt, mindössze 500 fontért (185 ezer forint) elkészíti egy ember hangját, ha a felhasználó a cég portálján felveszi a saját hangját, amint egy szöveget felolvas. A mesterséges intelligencia minden felolvasott szót száz apró részletre bont. Sok gyakran használt szó felbontása után végül megtanulja a felolvasó ember hangképzésének működését és minden egyes szóhoz hozzárendeli a benne lévő fonetikai elemek sorrendjét.

Az MI saját hangokat is képes előállítani és meg tudja jósolni, hogyan hangzana, ha egy adott ember egy beszélgetésben elmondana egy sor szót. Dupree korábbi hangfelvételei alapján “megtanították” egy ideghálózatnak megjósolni, hogy fog Dupree elmondani egy szöveget.

Júniustól Duppre hangja újra felhangzik az éterben. Az általa írt tudósításokat, ezentúl a MI fogja felolvasni. Bár a hang kissé gépszerű, de egyértelműen felismerhető a rádiós hangja.

(via, via)

 

Facebook hozzászólások

You may also like...