Вярнуцца да асновы інтэлекту ... каб сапраўды рухацца ў будучыню

Запіс гасцей Жозэ Эрнандэс-Арала, прафесар Тэхнічнага універсітэта Валенсіі

Два дзесяцігоддзі таму я пачаў працаваць над метрыкай машыннага інтэлекту. Да таго часу, у ледавіковыя дні другой зімы ІІ, мала хто быў сапраўды зацікаўлены ў вымярэнні чагосьці, чаго ІІ цалкам не хапала. І мала хто, напрыклад, Дэвід Л. Доў і я, цікавіліся метрыкамі выведкі, звязанай з тэорыяй алгарытмічнай інфармацыі, дзе мадэлі ўзаемадзеяння агента і свету былі паслядоўнасцю біт, а інтэлект быў сфармуляваны з выкарыстаннем тэорый Саламонафа і Уолласа. індуктыўнага высновы.

У той жа час, па-відаць, дзясяткі варыянтаў тэсту Тьюрынга былі прапанаваны кожны год, CAPTCHAs былі прадстаўлены, і Дэвід паказаў, як лёгка вырашыць некаторыя тэсты на IQ, выкарыстоўваючы вельмі простую праграму, заснаваную на падыходзе да вялікага пераключэння. І сёння прыйшла новая вясна AI, выкліканая квітнеючым полем машыннага навучання, што прыносіць больш эксперыментальны падыход да AI з усё большай колькасцю арыенціраў AI і спаборніцтваў (глядзіце папярэдні запіс у гэтым блогу для апытання).

Улічваючы гэтую 20-гадовую перспектыву, мінулы год шмат у чым быў асаблівым. Першы ў серыі майстар-класаў па ацэнцы ІІІ агульнага прызначэння ўзляцеў, паўтараючы ўзрастаючую цікавасць да ацэнкі сістэм штучнага агульнага інтэлекту (AGI), здольных знайсці розныя рашэнні для цэлага шэрагу задач. Ацэнка гэтых сістэм адрозніваецца і больш складана, чым традыцыйная ацэнка арыентаваных на заданне канкрэтных сістэм, такіх як робатызаваны прыбіральнік, мадэль крэдытавання, машынны перакладчык або машына-кіраўнік. Ідэя ацэнкі сістэм AI агульнага прызначэння з выкарыстаннем відэагульняў прыжылася. Аркадная серада навучання (гульні Atari 2600) альбо больш гнуткая мова вызначэння відэагульняў і звязаная з імі канкурэнцыя становяцца ўсё больш папулярнымі для ацэнкі AGI і нядаўніх прарываў.

У мінулым годзе таксама адбылося ўкараненне розных відаў платформаў ацэнкі AI, такіх як Microsoft Malmö, школа GoodAI, OpenAI's Gym and Universe, DeepMind's Lab, Facebook TorchCraft і CommAI-env. Грунтуючыся на наладзе навучання ўзмацнення (RL), гэтыя платформы дазваляюць ствараць мноства розных задач і падключаць агенты RL праз стандартны інтэрфейс. Шмат якія з гэтых платформаў добра падыходзяць для новых парадыгмаў у AI, такіх як глыбокае ўзмацненне навучання і некаторыя бібліятэкі машыннага навучання з адкрытым зыходным кодам. Пасля тысяч эпізодаў ці мільёнаў крокаў супраць новай задачы, гэтыя сістэмы здольныя атрымаць поспех, як правіла, лепш, чым прадукцыйнасць чалавека.

Нягледзячы на ​​мноства прыкладанняў і прарываў, якія былі атрыманы з гэтай парадыгмы, у гэтай вобласці існуе адзінае меркаванне, што галоўная адкрытая праблема заключаецца ў тым, як агент ІІ можа паўторна выкарыстоўваць прадстаўленні і навыкі ад адной задачы да новай, ствараючы гэта можна даведацца новае заданне значна хутчэй, пры дапамозе некалькіх прыкладаў, як гэта робяць людзі. Гэта можна разглядаць як праблему адлюстравання (як правіла, пад тэрмінам перадачы навучання) альбо можна разглядаць як паслядоўную праблему (звычайна пад умовамі паступовага, кумулятыўнага, паступовага, пастаяннага або навучальнага навучання).

Адзін з ключавых паняццяў, звязаны з такой здольнасцю сістэмы пабудовы новых канцэпцый і навыкаў над папярэднімі, звычайна называюць "кампазіцыйнасцю", добра дакументаванай у людзей з ранняга дзяцінства. Сістэмы могуць спалучаць уяўленні, канцэпцыі і навыкі, якія былі вывучаны раней, каб вырашыць новую праблему. Напрыклад, агент можа спалучаць здольнасць падымацца па лесвіцы, выкарыстоўваючы яе як магчымы выхад з пакоя, альбо агент можа даведацца множанне пасля вывучэння складання.

На мой погляд, дзве папярэднія платформы лепш падыходзяць для кампазіцыі: Malmö і CommAI-env. У Мальмё ёсць усе інгрэдыенты 3D-гульні, і даследчыкі ІІ могуць эксперыментаваць і ацэньваць агенты са зрокам і 3D-навігацыяй, што і дагэтуль рабілі шматлікія даследчыя працы з выкарыстаннем Мальме, бо ў цяперашні час гэта тэма AI. Аднак для мяне найбольш цікавай асаблівасцю Мальмё з'яўляецца будаўніцтва і майстэрства, дзе агенты абавязкова павінны спалучаць папярэднія канцэпцыі і навыкі, каб ствараць больш складаныя рэчы.

CommAI-env відавочна пераўзыходзіць гэты набор платформаў. Гэта не відэагульня ў 2D ці 3D. Відэа ці аўдыя там не выконваюць ніякай ролі. Узаемадзеянне проста вырабляецца праз паток біт уводу / вываду і ўзнагарод, якія з'яўляюцца толькі +1, 0 ці -1. У асноўным дзеянні і назіранні з'яўляюцца бінарнымі. Падстава CommAI-env заключаецца ў наданні вядомасці камунікатыўным навыкам, але ён усё яшчэ дазваляе насычанае ўзаемадзеянне, заканамернасці і задачы, "захоўваючы ўсе наступныя складанасці да мінімуму".

Прыклады ўзаемадзеяння ў асяроддзі CommAI-mini.

Калі я ўсвядоміў, што General AI Challenge выкарыстаў CommAI-env для сваёй размінкі, я быў у захапленні. Удзельнікі маглі засяродзіцца на агентах Радыё Свабода без складанасьці зроку і навігацыі. Вядома, зрок і навігацыя вельмі важныя для прыкладанняў AI, але яны ствараюць шмат дадатковых ускладненняў, калі мы хочам зразумець (і ацаніць) паступовае навучанне. Напрыклад, дзве роўныя задачы, для якіх змяняецца фактура сцен, патрабуюць большых намаганняў па перадачы, чым дзве некалькі розных задач з аднолькавай фактурай. Іншымі словамі, гэта выклікае дадатковыя незразумелыя фактары, якія значна абцяжараць аналіз пераносу задач і залежнасці задач. Тады мудры выбар выключыць гэта з раунда размінкі. Будуць выпадкі і падчас іншых раундаў, уключаючы зрок, навігацыю і іншыя складаныя варыянты. Пачынаючы з мінімальнага інтэрфейсу, каб ацаніць, ці здольныя агенты паступова вучыцца, гэта не толькі складаная задача, але і важная адкрытая праблема для агульнага ІІІ.

Акрамя таго, раунд размінкі змяніў CommAI-env такім чынам, што біты спакаваныя ў 8-бітныя (1 байт) сімвалы. Гэта робіць вызначэнне задач больш зразумелым і робіць кадаванне ASCII празрыстым для агентаў. У асноўным набор дзеянняў і назіранняў пашыраецца да 256. Але цікава, што мноства назіранняў і дзеянняў аднолькавае, што дазваляе шмат магчымасцей, якія з'яўляюцца незвычайнымі пры вывучэнні ўзмацнення, дзе гэтыя падмноствы розныя. Напрыклад, агент з прымітывамі, такімі як "скапіяваць увод для вываду", і іншымі аператарамі пераўтварэння паслядоўнасці можа стварыць іх для вырашэння задачы. Зменныя і іншыя віды абстракцый гуляюць ключавую ролю.

Гэта можа стварыць ўражанне, што мы вярнуліся да машын Цюрынга і сімвалічнага AI. У пэўнай ступені гэта так і шмат у чым адпавядае бачанню Тьюрынга ў яго артыкуле 1950 г.: "можна навучыць машыну пакараннямі і ўзнагародамі выконваць загады, прыведзеныя на нейкай мове, напрыклад, сімвалічнай мове". Але ў 2017 годзе ў нас ёсць шэраг метадаў, якія былі недаступныя ўсяго некалькі гадоў таму. Напрыклад, машыны нейронных цьюрынгаў і іншыя нейронныя сеткі з сімвалічнай памяццю могуць вельмі добра падыходзіць для гэтай праблемы.

Ні ў якім разе гэта не паказвае на тое, што легіён аматараў навучання глыбокаму ўзмацненню не можа прывесці свае апараты ў гэты разбор. Сапраўды, яны не будуць расчараваны гэтай праблемай, калі яны сапраўды старанна працуюць, каб адаптаваць глыбокае навучанне да гэтай праблемы. Магчыма, ім не спатрэбіцца скруткавая сетка, наладжаная на распазнаванне візуальнага ўзору, але ёсць шмат магчымасцей і праблем, як прымусіць глыбокае навучанне працаваць у такіх умовах, тым больш, што чым менш прыкладаў, тым лепш і глыбейшага навучання звычайна патрабуецца шмат прыклады.

У дадатак да гэтага, просты, сімвалічны паслядоўны інтэрфейс адкрывае выклік шматлікім іншым абласцям у ІІ, а не толькі перыядычным нейронным сеткам, але і метадам апрацоўкі натуральнай мовы, эвалюцыйным вылічэнні, алгарытмам, натхнёным сцісканнем, альбо нават абласцям, такім як індуктыўнае праграмаванне, з магутным радком -апрацоўка прымітываў і яго мэтазгоднасць для праблем з вельмі мала прыкладаў.

Я думаю, што ўсё вышэйсказанае робіць гэты разборны конкурс унікальным спаборніцтвам. Зразумела, паколькі ў мінулым у нас не было нічога падобнага, мы маглі б мець некаторыя сюрпрызы. Можа здарыцца, што нечаканая (ці нават наіўная) тэхніка можа паводзіць сябе значна лепш, чым іншыя (і людзі), альбо, магчыма, мы выявім, што ў гэты час ні адна тэхніка не здольная зрабіць нешта значнае.

Я нецярпліва бачу, як развіваецца гэты раўнд і што ўдзельнікі могуць інтэграваць і вынаходзіць, каб вырашыць паслядоўнасць мікра- і міні-задач. Я ўпэўнены, што мы з гэтым шмат чаму навучымся. Я спадзяюся, што машыны таксама будуць. І ўсе мы будзем рухацца наперад у наступны тур!

Хасэ Эрнандэс-Орала - прафесар Тэхнічнага універсітэта Валенсіі і аўтар кнігі "Мера ўсялякага розуму, ацэнка прыроднага і штучнага інтэлекту", Cambridge University Press, 2017.