DeepMind A.I. Mostovi med roboti in človeškimi glasovi

$config[ads_kvadrat] not found

Google's DeepMind AI Just Taught Itself To Walk

Google's DeepMind AI Just Taught Itself To Walk
Anonim

Umetna inteligenca je pravzaprav naredila robotske glasove bolj realistične.

DeepMind, ki je prej dokazal moč A.I. s premagovanjem človekovega igralca na Go v marcu in zmanjšanju računa za elektriko v polovici v juliju, je zdaj osredotočen na sintezo govora.

Raziskovalna skupina A.I, ki je del matične družbe Google Alphabet, je danes zjutraj razkrila, da je ustvarila novo tehnologijo, imenovano WaveNet, ki jo je mogoče uporabiti za natančnejše ustvarjanje govora, glasbe in drugih zvokov kot prej.

DeepMind pojasnjuje, da se veliko obstoječih metod sinteze govora zanaša na "zelo veliko bazo kratkih govornih fragmentov, ki so posneti iz enega zvočnika in nato ponovno združeni, da tvorijo popolne izreke." WaveNet pa uporablja "surovo valovno obliko avdio signala". Da ustvarite bolj realistične glasove in zvoke.

To pomeni, da WaveNet deluje z individualnimi zvoki, ki nastanejo, ko človek govori namesto uporabe popolnih zlogov ali celotnih besed. Ti zvoki se nato izvajajo skozi "računsko drag" proces, ki ga je DeepMind našel "bistvenega pomena za ustvarjanje kompleksnega, realističnega zvoka" s stroji.

Rezultat vsega tega dodatnega dela je 50-odstotno izboljšanje sintetiziranega govora v angleškem in kitajskem mandarinskem jeziku. Tukaj je primer govora, ustvarjenega z uporabo parametričnega besedila v govor, ki je danes običajen in ga DeepMind uporablja za prikaz, kako ta metoda sinteze govora ni na voljo:

In tukaj je primer istega stavka, ki ga ustvari WaveNet:

Ker podjetja nadaljujejo z delom na vmesnikih naravnega jezika, bo ponudba bolj realističnih odzivov postala vse pomembnejša. WaveNet lahko pomaga pri reševanju tega problema.

$config[ads_kvadrat] not found