Naujasis MIT algoritmas gali numatyti žmogaus sąveiką prieš jiems sukeldami

$config[ads_kvadrat] not found

Week 5, continued

Week 5, continued
Anonim

Mūsų nesugebėjimas skaityti kitų žmonių lėmė kai kuriuos epinius aukštus penkis nepavykusius ir praleistus bučinius. Net po patirties gyvenime sunku numatyti žmonių sąveiką. Tačiau MIT kompiuterių mokslų ir dirbtinio intelekto laboratorijos mokslininkai mano, kad gali padėti: su nauju giliu mokymosi algoritmu, kuris gali numatyti, kada du žmonės apkabins, bučiuos, purtys rankas ar penkis aukštus, jie ėmėsi didelių žingsnių link ateities palaimingai neturi tokių nepatogių akimirkų.

Jie tikisi, kad jų naujas algoritmas - apmokytas 600 valandų „YouTube“ vaizdo įrašų ir televizijos laidų Biuras, Krūmynai, Didžiojo sprogimo teorija, ir Nusivylusios namų šeimininkės - gali būti naudojama programuoti mažiau socialiai nepatogius robotus ir sukurti „Google“ stiklo ausines, kad galėtume pasiūlyti veiksmus prieš mums netgi praleisdami progą. Ateityje jie įsivaizduos, kad niekada nebūsi susišypsoję su aukštuoju penkių šansų su savo bendradarbiu.

Suprasdami, kad robotai mokosi būti socialiniais būdais tokiais pat būdais, kaip ir mes, buvo raktas į algoritmo sėkmę. „Žmonės automatiškai išmoksta numatyti veiksmus per patyrimą, o tai privertė mus domėtis, kad kompiuteriai su tokiu pačiu sveiku protu“, - sako CSAIL Ph.D. studentas Carl Vondrick, pirmasis autorius, susijęs su šiuo popieriumi, pateikiamas šią savaitę Tarptautinėje konferencijoje kompiuterinės vizijos ir modelių atpažinimo klausimais. „Mes norėjome parodyti, kad tik žiūrėdami didelius vaizdo įrašus, kompiuteriai gali įgyti pakankamai žinių, kad galėtų nuosekliai daryti prognozes apie savo aplinką.“

Vondrikas ir jo komanda mokė algoritmo daugelį „neuroninių tinklų“ analizuoti didžiulius duomenų kiekius šiuo atveju, Jim ir Pamo penkių aukštų valandas, o Mike ir Susan paslėptus bučinius. Atsižvelgiant į tokius veiksnius kaip ištiestos rankos, pakelta ranka arba ilgas žvilgsnis, kiekvienas neuroninis tinklas atspėjo, kas nutiks kitą sekundę, ir bendras sutarimas dėl tinklų buvo priimtas kaip galutinis „prognozavimas“. tyrimas.

Algoritmas gavo jį daugiau kaip 43 proc. Laiko. Nors tai gali atrodyti nepakankamai aukšta, kad būtų užtikrinta, jog mūsų kasdienės sąveikos bus mažiau keistos, tai yra didelis patobulinimas esamuose algoritmuose, kurių tikslumas yra tik 36 proc.

Be to, žmonės gali prognozuoti tik 71 proc. Laiko. Mums reikia visos pagalbos, kurią galime gauti.

Antroje tyrimo dalyje algoritmas buvo išmokytas prognozuoti, kas po penkių sekundžių scenoje pasirodys objektas - vietinės sėdynės kabės, tokios kaip nuotoliniai, indai ir šiukšlių dėžės. Pavyzdžiui, atidarius mikrobangų duris, yra gana didelė tikimybė, kad šalia bus rodomas puodelis.

Jų algoritmas dar nėra pakankamai tikslus, kad „Google“ stiklas tiesiog būtų, bet su bendraautoriumi Antonio Torralba, Ph.D. - finansuoja „Google“ fakulteto mokslinių tyrimų apdovanojimas ir „Vondrick“, dirbantis su „Google Ph.D.“ stipendija - mes galime statyti, kad jis ten pateks. Būsimosios algoritmo versijos, „Vondrick“ prognozuoja, gali būti naudojamos robotams programuoti, kad jie galėtų bendrauti su žmonėmis arba net mokyti apsaugos kameras užsiregistruoti, kai žmogus patenka arba sužeistas.

„Vaizdo įrašas nepatinka„ Pasirinkti savo nuotykius “knygą, kurioje galite pamatyti visus galimus kelius“, - sako Vondrick. „Ateityje yra dviprasmiška, todėl įdomu iššūkis sukurti sistemą, kuri naudodama šiuos vaizdus numato visas galimybes.“

$config[ads_kvadrat] not found