Ar „Google“ „Superhuman“ neuronų tinklas tikrai pasakys bet kurio vaizdo vietą?

$config[ads_kvadrat] not found

Justin Timberlake - What Goes Around...Comes Around

Justin Timberlake - What Goes Around...Comes Around
Anonim

Ieškoma vaizdų yra lengviau nei bet kada. Bet jei bandote rasti kažką atvaizdą toje vietoje, kuri nėra visiškai akivaizdi (taigi ne Egipto piramidės ar milžiniška nykščio skulptūra Paryžiuje), tai sunkiau, nei manote - netgi geografinės vietos informacija, pagrįsta tuo, kas yra vaizde.

Įveskite „Google“ inžinierių, vardu Tobias Weyand, ir savo kolegų porą. Pagal naują žurnalo žurnalą arXiv (tariamas „archyvas“), trio sukūrė giliai besimokantį įrenginį, galintį tiksliai nustatyti beveik bet kurios nuotraukos vietą, remiantis tik jo pikselių analize.

Norint, kad mašina sėkmingai atliktų tokią užduotį, norite suteikti jai galimybę intuicuoti informaciją, pagrįstą vizualiais įkalčiais. Norite, kad jis galvotų, kitaip tariant, kaip žmogus.

Weyandas sukūrė dirbtinį neuroninį tinklą - mašinų sistemą, skirtą imituoti smegenų neurologinius kelius, kurie leidžia jam išmokti, apdoroti ir prisiminti tokią informaciją kaip žmogus. Ši nauja sistema „PlaNet“, matyt, gali atverti žmones, kad nustatytų vaizdų vietas, neatsižvelgiant į tai, kokioje aplinkoje tai būtų - ar tai būtų viduje, ar lauke, ir kurioje yra bet kokie unikalūs ar netikslingi vaizdiniai ženklai.

Kaip veikia „PlaNet“? Weyand ir jo komanda suskirstė pasaulio žemėlapį į tinklelį, kuriame įvairiuose regionuose buvo išdėstyta daugiau kaip 26 000 kvadratinių formų, priklausomai nuo to, kiek vaizdų buvo paimta tose vietose. Didelėse aikštėse sutelktos tankios vietos, kuriose yra daug nuotraukų, o didesni, tolesni regionai gali supjaustyti į didesnius kvadratus.

Tuomet komanda sukūrė didelę jau geografinių vaizdų duomenų bazę - beveik 126 mln. Skirtingų nuotraukų. Apie 91 mln. Buvo panaudota kaip duomenų rinkinys, skirtas mokyti „PlaNet“, kaip išsiaiškinti, kokį vaizdą galima įdėti į tinklą pasaulio žemėlapyje.

Tada neuronų tinklas buvo pavesta geografiškai perkelti kitus 34 milijonus vaizdų iš duomenų bazės. Galiausiai, „PlaNet“ buvo nustatytas pagal 2.3 milijonų geotaginių vaizdų rinkinį iš „Flickr“.

Rezultatai? „PlaNet“ gali nustatyti kilmės šalį 28,4 proc. Nuotraukų ir žemyną 48 proc. Be to, sistema gali nustatyti gatvės lygio vietą 3,6 proc. „Flickr“ vaizdų ir 10,1 proc. Miesto lygio vietą.

„PlaNet“ yra geriau nei dauguma žmonių, net ir didžiausių globotorių. Weyand įdarbino 10 gerai išvykusių asmenų, norinčių konkuruoti su „PlaNet“ žaidimų „Google“ gatvės vaizde esančių nuotraukų ženklinimo vietoje.

„Iš viso„ PlaNet “laimėjo 28 iš 50 raundų, kurių vidurkio lokalizacijos paklaida buvo 1131,7 km, o vidutinė žmogaus lokalizavimo klaida buvo 2320,75 km“, - rašė mokslininkai. „Šis nedidelio masto eksperimentas rodo, kad„ PlaNet “pasiekia viršžmogišką našumą„ Geolocating Street View “scenų užduotyje.“

Ar tai tikra? Ar „Google“ inžinierius tikrai sukūrė „žmogų“ A.I. sistema?

Kai kalbama apie vaizdų geolokavimą, galbūt. Ir tai ne visai stebina - A.I. neturi iš esmės imituoti žmogaus smegenų visais būdais, bet keliais konkrečiais būdais, kaip atlikti daug sudėtingesnes užduotis, pranokti žmogaus apribojimus. Taigi, ta prasme, ką rašytojai rašo, yra tiesa.

Vis dėlto „PlaNet“ vadinama „neuroniniu tinklu“. Tai idealus tokios rūšies technologija galėtų išmokti daug daugiau nei vaizdo geolokacija. A.I. sistemos sugeba rašyti panašumus ir žaisti Super Mario, tačiau tai yra nedidelis dalykas, palyginti su idealiąja „magistro“ sistema, kuri gali automatiškai stebėti ir išlaikyti gyvybingumą, valdyti transportą ar energetikos infrastruktūrą ir daug daugiau.

$config[ads_kvadrat] not found