IA õpib võlukubika ise lahendama vaid 44 tunniga

Masina treenimine selliste mängude võitmiseks, mis nõuavad ainuüksi palju inimlikke põhjendusi, näiteks male või Go, on juba tehisintellekti (AI) valdkonna jaoks reaalsus koos õppimise nn tugevdamisega. Nüüd on Irvine'i California ülikooli teadlased astunud sammu edasi: nad lõid DeepCube - süsteemi, mis nõudis minimaalset järelevalvet, et suuta traditsiooniline võlukuup iseenesest kätte saada vaid 44 tunniga.

Seda nimetati ka Rubiku kuubikuks, mille lõi ungari Erno Rubik 1974. aastal. See pakub kolmemõõtmelist puslet, milles on üle 43 kvintiljoni kombinatsiooni ja mida saab lahendada vähemalt 26 käiguga. Mänguasi on praeguseks väga edukas ja on selle loomisest alates müünud ​​üle 350 miljoni ühiku - isegi väljakutse suurendamiseks isegi mõned variatsioonid saanud.

Kuubiku ületamiseks pidid teadlased minema male- ja Go-katsetes täheldatust pisut kaugemale. Selle põhjuseks on see, et edukus tühikutega toimimisel ei põhine samal viisil premeerimisel ja seetõttu tuleb arvutil teistmoodi orienteeruda. viis teada saada, kas suundute mõne lahenduse poole õigesti.

Kuidas see süsteem töötab?

Stephen McAleer ja tema kolleegid California ülikoolist Irvine'is on loonud uue süvaõppe tehnika, mida nimetatakse „iseõppinud iteratsiooniks“, mis võib õpetada AI-le oma palgasüsteemi loomist, et näha, kas iga tehtud liigutus võib viia eduni.

Selleks peab ta väljuma juba lahendatud võlukuubikust ja tegema samm-sammult tagurpidi. See väljakutse mõistmise viis pole kõige sobivam, kuid just seal tulevadki närvivõrk ja selle keerulised arvutused, mis suutsid selle protsessi käigus lüngad täita. Pärast seda koolitust koondab masin otsingupuu, milles on erinevad sätted iga seade jaoks.

maagiline kuup

Skeem on esitatud teadlaste dokumentatsioonis

"Meie algoritm on võimeline lahendama 100% juhuslikult segatud kuubikutest, saavutades samal ajal keskmise eraldusvõime 30 käiguga - mis on väiksem või võrdne inimekspertide jõudlusega, " tähistas McAleer. 32-tuumalise Intel Xeon E5-2620 serveril ja kolmel Nvidia Titan XP GPU-l treeniti 44 tunni jooksul kaks miljonit erinevat iteratsiooni kaheksa miljardi kuubikuna.

Uudised toovad selle teema juurde rohkem valgust, sest sügav õppimine on ikka veel kõvasti vaeva näinud, et aidata AI lõpule viia selliseid mänge nagu Sokoban, Montezuma's Revenge ja algarvu faktooring iseseisvalt.

Ja kus saab seda rakendada?

Ilmselt pole lõppeesmärk lihtsalt luua süsteem, mis suudaks võlukuubist üle saada. Seda saab kasutada nii, et masin suudab teadaoleva lahendusega lahendada ootamatuid järjestusi kombinatsioonide universumis. Teadlaste sõnul saab DeepCube "juba varem omandatud teadmisi algebraliselt manipuleerida, et vastata uuele küsimusele".

Neid eesmärke täites saab uudsust rakendada uute ravimite avastamiseks, DNA-analüüside tegemiseks ja robotite abistamiseks meie inimese igapäevaelu mõne tüüpilise olukorra otsustamiseks. Ootame järgmisi samme, kuna juba on eesmärgid rasketest 16-küljelistest kuubikutest üle saada.

***

Kas teate Mega Curioso uudiskirja? Igal nädalal valmistame eksklusiivset sisu selle suure maailma suurimate uudishimude ja veidrate asjade armastajatele! Registreerige oma e-posti aadress ja ärge jätke seda võimalust ühendust võtmiseks!

IA õpib omal käel TecMundo vahendusel maagiakuubi lahendamist vaid 44 tunniga