Natūralios kalbos supratimas yra A.I. Balso atpažinimas

$config[ads_kvadrat] not found

ŠVENTOSIOS DVASIOS BALSAS / Kaip Dievas kalba žmogui? / Vilma Ditkevičius

ŠVENTOSIOS DVASIOS BALSAS / Kaip Dievas kalba žmogui? / Vilma Ditkevičius
Anonim

Su „Amazon“ ir „Siri“ pastoviu pajėgumu įsisavinti daugiau darbų (ir gauti vis daugiau ir daugiau), daugelis klausia: kas toliau yra natūralaus kalbos supratimo ir pokalbių balso sąsajų?

Šioje lenktynėje yra keletas kompanijų, kurios kaklo ir kaklo. „Wit.ai“, kompanija „Facebook“ įsigijo, galite žaisti aplink demo. (Išbandykite šią komandą: „Noriu žiūrėti katę“.) „Apple“ turi „HomeKit“ ir su juo daro tai, ką „Apple“ daro geriausiai. „Amazon“ taip pat yra priekyje su „Alexa“ įrengtu „Echo“ ir „Echo Dot“.

Viena kompanija karšta dėl natūralaus kalbos supratimo tako yra MindMeld. „MindMeld“ suteikia savo natūralios kalbos supratimo galimybes kitoms įmonėms, norinčioms pridėti intelektualias balso sąsajas su savo produktais, paslaugomis ar įrenginiais. San Franciske įsikūrusi bendrovė suteikia partneriams infrastruktūros ir pritaikymo galimybes, kad jų įrenginiai galėtų turėti savo tikslinius asmeninius padėjėjus. „MindMeld“ neseniai paskelbė tokią partnerystę su „Spotify“, bet taip pat dirba su automobilių kompanijomis, gynybos agentūromis, elektroninės prekybos įmonėmis ir kt. (Ir, žinoma, ji negali pasidalinti daugybe tokių partnerystės specifikų.)

Inversinis kalbėjo su „MindMeld“ „Sam Vasisht“ apie balso atpažinimo lauko būklę, bet jis greitai pažymėjo, kad „balso atpažinimas“, kaip įmonė, dabar yra „kasdienė tema“. Šiomis dienomis kalbama apie „natūralų kalbos supratimą. „Balso atpažinimas beveik pasiekė savo muzitą: po 50 metų nelygių metų, AI dabar gali veiksmingai atpažinti kalbą. Šios sistemos yra beveik geresnės už žmones, ir netrukus netrukus pranoksta tik mirtinguosius.

Numatomas kitas žingsnis, tada - kaip ir vaiko vystymasis - yra išmokyti šias sistemas suprasti kalba, kurią jie dabar gali atpažinti. „Šis žmogus kalba; tai yra žodžiai „yra toli nuo:“ Aš suprantu, ką sako šis žmogus; leiskite man padėti. “

Ir kad tolesnis žingsnis ir vystymasis reikalauja aiškinimo prasme: Imituoti žmogaus proto procesą žodžiu. Šioje lygtyje yra dvi dalys. Pirmasis yra ketinimas: koks yra žmogaus tikslas ar noras kalbėti šiuo sakiniu? Kompiuteris, galintis išgauti iš sakyto sakinio, gali „suprasti“, kad žmogus nori daryti įtaką x arba bendrauti su y. Sujungtas su šiuo procesu yra antroji lygties dalis: subjektas. A.I. turi žinoti, kaip nustatyti aptariamą subjektą, žmogaus tikslo objektą.

Norėdami tai padaryti, MindMeld nėra (kaip maniau, ar tikiuosi), įdarbindamas filosofus.Jame dirba natūralios kalbos specialistai, tačiau daugelis A.I. „Mokymosi“ procesas pats savaime yra gana rimtas. Jei mokote sistemą, kad suprastumėte kavos užsakymus, jums reikia parodyti sistemą visais skirtingais būdais, kuriuos žmonės galbūt gali užsisakyti kavos.

„Norėčiau mokas.“

„Ar galėčiau turėti puodelį Joe?“

„Tik didelė kava man.“

Ir čia atvyksta natūralių kalbų ekspertai - lingvistai. Bet net ir tai nebereikalinga, nes mes galime perduoti duomenis. Šios priemonės leidžia jums užduoti tūkstančiams žmonių tą patį klausimą ir surinkti atsakymus. Tuomet tuos atsakymus įteisite į A.I., ir voila: A.I. gali reaguoti į įvairius galimus tyrimus. „Iš tūkstančių užklausų dabar mes galime tik iš esmės išmokti, kaip galima generuoti milijardus kitų užklausų“, - sako Vasisht.

Inversinis paklausė „Vasisht“, kuris jau seniai yra A.I. ir natūralios kalbos supratimo sritis, spekuliuoti už mus.

Ar MindMeld gali dalyvauti išplėstiniame dialoge? Pavyzdžiui, jei paklausiu tolesnio klausimo, ar A.I. suprasti ir atsakyti?

Taip. Tai yra dizaino dalis. Jei kas nors užduoda klausimą, kuris yra neišsamus, pvz., Jei užsakau kavą, ir nenurodau norimos kavos dydžio, jis grįš ir pasakys: „Kokia tavo kava nori? “

Ar tikitės, kad „Turing“ testas padarytų pažangą?

Manau, kad esame gana artimi. Tai reiškia, kad „IBM Watson“ Pavojus!, ir manau, kad tai buvo tikrai geras pavyzdys. Esame tuo momentu: tai labai artima. Kaip ir dabar, kalbant apie kalbos atpažinimą, mes esame tokioje vietoje, kur mašinos yra tokios pat geros kaip žmonės, manau, kad mes, žinoma, per ateinančius trejus ar penkerius metus tapsime tašku, kuriame dauguma šių pokalbių balsų sistemos bus laikomos tokia pat gera kaip ir žmonės.

Kokių namų automatizavimo dalykų daro MindMeld?

Mes galime taikyti savo technologiją bet kokio tipo gaminiams, bet kokioms paslaugoms, bet kokiems duomenų domenams. Namų automatizavimas yra vienas iš jų. Namuose turite apšvietimo valdymą, termostatą, apsaugos sistemas, garso sistemas, vaizdo sistemas, visus tuos dalykus. Mes galime kontroliuoti bet kurią iš sistemų, jei yra tinkama sąsaja.

Ką norėtumėte, kad galėtumėte prisijungti prie MindMeld savo namuose?

Manau, kad labiau pažengę naudojimo atvejai - pvz., Kalbėjimas su „Spotify“, norėdamas pasakyti „Žaisti mane„ Rolling Stones “grojaraštyje“, arba „Žaisti mane klasikine muzika šį vakarą“ - tokie dalykai būtų… nuostabūs.

Viskas, kas netikėtesnė, ar ne, kad norėtumėte valdyti savo balsu?

Tai, ką aš jums aprašiau, yra tai, kas manau, yra neišvengiama. Kitaip tariant, tai įvyks labai greitai. Manau, kad tai neįvyks, pavyzdžiui, mikrobangų krosnelės, kavos aparatai ir šaldytuvai. Šių prietaisų kontrolė - todėl galiu iš esmės pasakyti: „Ar mano kavos aparatas paruoštas kavai gaminti? Įjunkite kavos aparatą “ir, jei jis nebuvo paruoštas, jis turėtų grįžti ir pasakyti„ Atsiprašau, bet jūsų kavos aparatas nėra paruoštas “- toks intelektas dar neegzistuoja. Tai bus šventasis Gralis: kur iš esmės kiekvienas prietaisas gali pasikalbėti su jumis ir pasakyti, ką jis gali ir negali padaryti. Bet mes dar ne visai ten.

Ką manote, kad pramonė laikosi atgal?

Tai yra labai pigūs prietaisai. Aš turiu galvoje, tai yra prietaisai, kuriuos galite nusipirkti beveik nieko. Prieš dešimt metų jie kainavo daug daugiau. Taigi, naujų funkcijų kūrimas yra kažkas, kas padidina šių įrenginių išlaidas. Galiausiai dabartinė vertės pasiūlymas yra labai stiprus; dauguma šių gamintojų nėra linkę pridėti naujų funkcijų, nebent jie yra labai mažomis sąnaudomis.

Manau, kad tai vienas aspektas. Kitas aspektas yra tai, kad kalbame apie šių įrenginių prijungimą. Taigi, norint prijungti šiuos įrenginius, turi būti daugiau nei tik balso naudojimo atvejis. Turi būti daugiau galimybių, kurias reikia važiuoti šiuo ryšiu, kol jie taps perspektyvūs.

Ar žinote bet kokią kompaniją, kuri dirba su pastaraisiais pajėgumais?

Daugelis puslaidininkių kompanijų dirba labai mažomis kainomis veikiančiomis mikrofonų grupėmis. Tai, ką jūs iš esmės galite įdėti - labai mažomis kainomis - beveik bet kokiame įrenginyje ar programoje - tai leistų ten būti balso įvesties. Ir jūs neturite stovėti šalia šių įrenginių - galite kalbėti nuo 10 metrų. Sukurkite šią galimybę - manau, kad tai yra pradinis taškas. Ir manau, kad tai leis žmonėms pradėti įrengti mikrofonus, o paskui - kita, pažangios galimybės. Bet dabar aš nežinau jokios įmonės, kuriančios tokį protingą kavos aparatą, ar protingą mikrobangų krosnelę ar skalbimo mašiną.

Koks yra jūsų geriausias įvertinimas, kai turime visiškai protingus namus, visiškai protingus apartamentus?

Šiandien mes beveik visuose namuose turime visus esminius posistemius, kuriuos nori automatizuoti ir kurie gali būti automatizuoti. Tai apima šviesas, termostatus, apsaugos sistemas, garažo duris, durų užraktus. Visi šie dalykai gali būti padaryti. Problema iš tikrųjų yra susijusi su kainų taškais. Tai vis dar yra ta kaina, kurioje daugiausia yra ankstyvieji ir žmonės, kuriems jų reikia. Tačiau šių dalykų kainų taškai smarkiai sumažėja, labai greitai. Manau, kad per ateinančius kelerius metus mes tikriausiai gausime šiuos posistemius į masinę rinką.

Kiti dalykai, apie kuriuos kalbėjau - labai pigių prietaisų automatizavimas - manau, kad jie greičiausiai yra per penkerių iki septynerių metų laikotarpį. Daugiau nei 10 metų, prieš tai tapo realybe. Tačiau, kaip jau minėjau, tai yra dalykų, kuriems reikės daug kitų dalykų. Ir tai gali atsitikti anksčiau, jei šios įvairios sudedamosios dalys greičiau sujungs.

Ką manote, kad Niujorko ar San Francisko butas atrodytų, tarkim, 2050 m.?

2050 m. Oho. Manau, kad būsime visiškai ten. Tokie dalykai, kuriuos matome mokslinės fantastikos filmuose - kur jūs galite gana daug kalbėti su kiekviena jūsų namų sistema ir valdyti viską balsu - manau, kad tokios galimybės bus plačiai paplitusios. Žinoma, tokiuose miestuose kaip Niujorkas ir San Franciskas.

$config[ads_kvadrat] not found