DeepMind A.I. Tiltai tarp roboto ir žmogaus balsų

$config[ads_kvadrat] not found

AlphaGo - The Movie | Full Documentary

AlphaGo - The Movie | Full Documentary
Anonim

Dirbtinis intelektas, sukurtas robotų balsams, skamba daug realiau.

DeepMind, kuris anksčiau parodė A.I. kovo mėn. „Go“ užmušdamas žmogaus žaidėją ir per pusę sumažindamas savo galios sąskaitą, dabar daugiausia dėmesio skiriama kalbų sintezei.

A.I tyrimo grupė, kuri yra „Google“ patronuojančios bendrovės „Alphabet“ dalis, šį rytą atskleidė, kad sukūrė naują „WaveNet“ technologiją, kuri gali būti naudojama kalbos, muzikos ir kitų garsų generavimui tiksliau nei anksčiau.

„DeepMind“ paaiškina, kad daugelis esamų kalbos sintezės metodų remiasi „labai didelės trumpų kalbų fragmentų duomenų bazės įrašymu iš vieno garsiakalbio ir po to rekombinuoja, kad būtų sukurti visiškai išsakymai.“ WaveNet, kita vertus, naudoja „neapibrėžtą garso signalo bangą“ „Sukurti realesnius balsus ir garsus.

Tai reiškia, kad „WaveNet“ dirba su atskirais garsais, sukurtais, kai žmogus kalba, o ne naudodamas visiškus skiemenis ar visus žodžius. Tuomet šie garsai vyksta per „skaičiavimo brangų“ procesą, kurį „DeepMind“ rado „būtinybe sukurti sudėtingus, realistiškus garsus“ su mašinomis.

Viso to papildomo darbo rezultatas - 50 proc. Pagerėjęs sintezuotos kalbos anglų ir kinų mandarinu. Toliau pateikiamas kalbos, sukurtos naudojant parametrinį tekstą į kalbą, pavyzdys, kuris šiandien yra bendras, naudojamas DeepMind, kad parodytų, kaip trūksta šio kalbos sintezės metodo:

Ir čia yra to paties sakinio, kurį sukūrė „WaveNet“, pavyzdys:

Kadangi įmonės tęsia darbą dėl natūralių kalbų sąsajų, vis svarbesnis bus realistiškesnis atsakas. WaveNet gali padėti išspręsti šią problemą.

$config[ads_kvadrat] not found