Kodėl A.I. Gali būti sunku suprasti arabų kalbą

$config[ads_kvadrat] not found

AYLA, My Korean Daughter, Daughter of War, English plus 95 subtitles

AYLA, My Korean Daughter, Daughter of War, English plus 95 subtitles
Anonim

Dirbtinio intelekto pasaulyje duomenys yra karalius. Kuo daugiau jūs turite, tuo geriau, kai jūsų įrankiai tampa sistemomis, galintys „daugiau sužinoti“ apie tai, ko tikėtis. Bet priklausomai nuo platformos A.I. teigia, kad kai kurios kalbos gali būti geriau atstovaujamos nei kitos, teigia „Yahoo Labs“ mokslininkas Miriam Redi.

„Pavyzdžiui, kaip Flickr, kur mes imamės mūsų duomenų, kai kurios kalbos yra labai mažai atstovaujamos“, - sakė Redi, kalbėdamas ketvirtadienį Londone vykusiame gilaus mokymosi susitikime. „Taigi mes turime anglų kalbą, milijonus vaizdų anglų kalbai, bet galbūt turime 100 000 arabų kalbų.“

„Redi“ komanda dirba su priemone, kuri gali atpažinti nematomus vaizdų elementus, pvz., Kultūrines vertybes ir emocines konotacijas. Priemonė analizuoja tekstą, pridėtą prie viešai prieinamų nuotraukų „Flickr“. Laikui bėgant, A.I. pradeda suprasti, kodėl kažkas gali žymėti vaizdą „laiminga šalis“ arba „nepatogus momentas“, tačiau šios idėjos išaugs vis tiksliau, nes įrankis analizuos daugiau vaizdų.

„Deja, arabų kalbų atvaizdų tikslumo nustatymas yra mažesnis, nes neturime pakankamai duomenų, - sakė Redi.

Kalbose, kuriose buvo daugiau duomenų, „Redi“ komanda pastebėjo keletą įdomių modelių. Romanų kalbos, pvz., Prancūzų ir ispanų kalbos, buvo linkusios išreikšti save panašiu būdu, o italų kalba buvo vienintelė kalba, kurioje vartotojai nustatė vaizdus su „mokesčių vengimu“.

Kalbos kliūtys vis dar išlieka problema A.I. mokslininkai. Kiekvienas, kuris naudojasi „Google“ vertimu, žinos, kad kalbų perjungimas niekada nėra toks paprastas, kaip atrodo. Tačiau nauji pokyčiai keičia dalykus, o „Facebook“ šią vasarą praneša, kad ji artėja prie svajonės apie vieno kalbos socialinį tinklą, automatiškai verčdama tekstus vartotojams.

Kalbų barjerų pašalinimo pokyčiai gali padėti skatinti tarptautinį bendravimą, tačiau tokiems projektams kaip „Redi“ nėra jokio realaus žmogaus sukeltų nuotaikos duomenų.

$config[ads_kvadrat] not found