DeepMind A.I. Tilts starp robotu un cilvēka balsīm

$config[ads_kvadrat] not found

DeepMind: The Podcast | Episode 4: AI, Robot

DeepMind: The Podcast | Episode 4: AI, Robot
Anonim

Mākslīgais intelekts tikai padarīja robotu balsis daudz reālistiskāku.

DeepMind, kas iepriekš parādīja A.I. martā uzvarot cilvēka spēlētāju Go pusē un jūlija pusē samazinot savu rēķinu, tagad koncentrējas uz runas sintēzi.

A.I pētniecības grupa, kas ir daļa no Google mātesuzņēmuma Alphabet, šorīt atklāja, ka tā ir radījusi jaunu tehnoloģiju, ko sauc par WaveNet, ko var izmantot, lai precīzāk ģenerētu runu, mūziku un citas skaņas.

DeepMind paskaidro, ka daudzas esošās runas sintēzes metodes paļaujas uz “ļoti lielu īsu runas fragmentu datu bāzi, kas ierakstīta no viena skaļruņa un pēc tam rekombinē, lai veidotu pilnīgas runas.” WaveNet, no otras puses, izmanto “audio signāla neapstrādātu viļņu formu “Lai radītu reālākas balsis un skaņas.

Tas nozīmē, ka WaveNet strādā ar atsevišķām skaņām, kas radītas, kad cilvēks runā, nevis izmanto pilnīgas zilbes vai veselus vārdus. Pēc tam šīs skaņas tiek vadītas, izmantojot „skaitļošanas ziņā dārgu” procesu, ko DeepMind ir atradis “būtiski, lai radītu sarežģītu, reālistisku skanējumu” ar mašīnām.

Visu šo papildu darbu rezultāts ir 50% uzlabojums sintezētajai runai ASV angļu un ķīniešu mandarīnos. Šeit ir piemērs runai, kas radīta, izmantojot parametru teksta runu, kas šodien ir izplatīta, ko DeepMind izmanto, lai parādītu, kā trūkst šīs runas sintēzes metodes:

Un šeit ir piemērs tam pašam teikumam, ko radījis WaveNet:

Tā kā uzņēmumi turpina darbu pie dabisko valodu saskarnēm, arvien svarīgāka kļūs reālistiskākas reakcijas. WaveNet var palīdzēt atrisināt šo problēmu.

$config[ads_kvadrat] not found