Gilus „Sustiprinimas mokymasis“ - tai mokomieji robotai, nauji įgūdžiai greičiau nei bet kada

$config[ads_kvadrat] not found

Robotas Pagalbininkas - Vaikiškos Dainelės Dainų Karuselė.TV

Robotas Pagalbininkas - Vaikiškos Dainelės Dainų Karuselė.TV
Anonim

Robotai mokosi, kaip užbaigti užduotis sukurtose virtualiuose pasauliuose, tobulinti įgūdžius per kelias valandas, kurios kitaip gali užtrukti mėnesius. Imituotas giliai sutvirtinantis mokymasis (arba „Deep RL“) reiškia įgūdį, kuris paprastai užtruks 55 dienas. mokytis realiame pasaulyje užtrunka tik vieną dieną pernelyg pagreitintoje klasėje.

„Tai yra potencialas iš tikrųjų revoliucionuoti tai, ką galime padaryti robotikos srityje“, - ketvirtadienį Londone vykusiame „Re-Work Deep Learning“ aukščiausiojo lygio susitikime sakė „Google DeepMind“ mokslininkas Raia Hadsell. „Mes galime išmokti žmogiškojo lygio įgūdžių.“

Tai gali skambėti priešais intuityviai, nes tikrai robotų taškas yra programuotojai, kurie gali išmokyti juos daryti viską, tiesa? Projektuojant mašiną, kuri veikia realiame pasaulyje, robotams reikia daug duomenų, kad būtų galima suprasti, kaip atlikti užduotį nepažįstamoje situacijoje. A.I. gali naudoti šiuos duomenis „išmokti“ įgūdžius, pagrįstus visais ankstesniais atvejais.

Giliai sustiprintas mokymasis renka tuos duomenis panašiai kaip žmonės mokosi: robotas atliks užduotį pakartotinai, pavyzdžiui, gaudamas kamuolį, ir įrašo duomenis, kad sukurtų vaizdą apie tai, kaip geriausiai sugauti kamuolį nauja situacija. Kai „DeepMind“ 2013 m. Naudojo modelį, kad mokytų robotą, kaip įvaldyti „Atari“ žaidimus, paprasčiausiai sėdint jį priešais ekraną ir pasakydamas apie galutinį tikslą, mokslinė bendruomenė jį myli.

Problema yra ta, kad tai trunka amžinai. Jūs turite keletą kartų mesti kamuoliukus į robotą arba Atari atveju, palikite robotą tik savo miegamajame. Veikdami „MuJoCo“ modeliavimą, kartu su progresyviu neuroniniu tinklu, treneriai gali paleisti robotą imituojančią programą, perduoti išmoktą elgesį robotui ir žemėlapius virtualius judesius į realųjį pasaulį.

„Mes galime paleisti tuos simuliatorius visą dieną ir visą naktį“, - sakė Hadels.

Rezultatai kalba už save. Šis robotas, gavęs gaudymo diplomą, dabar gali sekti virtualius kamuoliukus taip, tarsi jie būtų tikri, primindami ją didelei dienai, kai prašoma sugauti tikrą kamuolį:

$config[ads_kvadrat] not found