Չնայած մասնագիտական շրջանակների և լրատվական միջոցների հիացական արձագանքներին, մեքենայական խոր ուսուցումը (Deep Learning) մնում է անբավարար գնահատված և դեռևս ամբողջապես չգիտակցված գիտատեխնոլոգիական մեթոդ։ Վերջին տարիներին նեյրոցանցային մոտեցման առարկայական հաջողությունները զանազան՝ մեծ մասամբ արհեստական և ցածրորակ օրակարգերի ընդհանուր աղմուկի ներքո, չեն արժանանում պատշաճ ու համարժեք ուշադրության։
Ուստի կարիք կա ամեն առիթով բացատրել և շեշտել, թե հեղափոխական ի՞նչ շրջադարձի մասին է խոսքը, որը հաշված տարիներում վերափոխելու արդեն հինգ դար կարծրացած գիտական միտքը՝ ստեղծված այսպես կոչված զուտ «ռացիոնալիստական/մեխանիկական» սկզբունքերով։
Մեքենայական խոր ուսուցումը ոչ մի ընհանուր եզր չունի ռացիոնալիզմի հետ։ Ավելին, այն կարելի է ասել ժխտումն է ինչպես ռացոնալիզմը, այնպես էլ հարյուրամյակներով ընդունված գիտակա֊կրթական մեթոդները։
Մեկ պարզ օրինակ։
Անգամ ՏՏ ոլորտից հեռու մարդիկ գիտեն, որ ծրագրավորողների հիմնական առաքելությունը դա կոդավորումն է։ Այսինքն այս բնագավառի մասնագենտերը պարտավոր են կուտակել առավելագույն գիտելիքներ ալգորիթմներ մշակելու համար։ Սակայն հայտնվում է մեքենայական խոր ուսուցումը իր նեյոցանցային տեխնոլոգիաներով և հայտարարում, որ կոդավորումը՝ ալգորիթմների մշակումը դա մեքենաների գործն է։
Ոչ ավել, ոչ պակաս․ ալգորիթ պետք է մշակեն մեքենաները, իսկ մարդիկ՝ մասնագետները պետք է ապահովեն անհրաժեշտ նյութերով, ավելի ճիշտ նյութերի մատուցման մեխանիզմներով, քանի որ մեքենաները իրենք էլ կարող են որոնել և համալրել տեղեկատվական պաշարները։
Սա է մեքենայական խոր ուսուցման ողջ էությունը։ Մնացած երկրորդական խոսքեր ու մանրունքներ են կամ ուղղակի ֆասադներ։
Սովորաբար մեքենայական խոր ուսուցման ճարտարապետները մեկ փաստարկ են ներկայացնում թերահավատների համար։ Դա նա է, որ ցանկացած երեխա իր կյանքի առաջին տարիներին յուրացնում է ահռելի քանակության ինֆորմացիա և այնպիսի բարդ համակարգ, ինչպիսին լեզուն է առանց բարդ քերականական կանոների ուսումնասիրության։ Ուղղակի երեխան կլանում է շրջակա աշխարհից եկող ձայները ուղղորդելով դրանք դեպի նեյրոններ։
Եկեք խոստովանեք, որ ցանկացած մանուկ դա անում է փայլուն և նույն հաջողույթամբ, եթե նա հայտվում է ոչ հարազատ միջավայրում։ Ասենք, Չինաստանում հայտնված հայ մանուկը կյուրացնի չինարենը նույնչափ գերազանցորեն, ինչպես հայերենը։ Եւ հակառակը։
Ահա այն մետաֆիզիկան, որը չի կարող բացատրել մեր օրերի մեխանիստական ռացիոնալիզմը, որը ձևավորվել դեռ մեր թվարկության 15֊16֊րդ դարերում։
Եթե այս այլընտանքային մեթոդը հարուցում է անհարմարություն, կարելի է ի հարկե խխունջի նման պատսպարվել պարզ ու հարազատ դարձած ռացիոնալիզմի կաղապարի մեջ և կրքոտորեն ժխտել այն, սակայն ազգային, հանրային, պետական մեծ մարտահրավերների պայմաններում ավելի խելամիտ է օր առաջ վերցնել այն զինության և ծառայացնել սեփական խնդիրների լուծման համար։
Առավել ևս նշված մետաֆիզիկան ընդամենը վաղուց մոռացված հրաշագործ տեխնոլոգիա է՝ մեկն այն բազմազաններից, որոնց շնորհիվ հազարամյակներ առաջ մեր նախնիները արարում էին այսօրվա գիտության տեսանկյունից անբացատրելի տեխնիկական հրաշքներ։
Ինչպես նշվեց, կա մեկ նախապայման մեքենայական ուսուցման կիրառման համար։ Դա անհրաժեշտ տվյալների ապահովումն է։ Որքան շատ են և ճշգրիտ տվյալները, այնքան մեքենայական ուսուցման ճանապարհով “գրված” ալգորիթմներն անթերի են։
Տվյալների հավաքածուն կոչվում են corpus կամ dataset: Այն բաղկացած է input (ինչ որ տրամադրելու եք ծրագրին) և output (ինչ ցանկանում ենք ստանալ արդյունքում) զույգից պարզագույն օրինակների տեսքով։
Օրինակ համար․ եթե ցանկանում եք ստանալ կմ֊ից մղոն կամ ˚C֊ից ºF փոխակերպման բանաձև, ուղղակի նշում ենք ձեզ հայտնի զույգերը։
2020 թվականի հունվարի դրությամբ մեխանիկական ձայների սինթեզման համար կար ընդամենը 20 ժամ տևողության կորպուս, այն էլ մեր նախաձեռնության կողմից հավաքված։ Համեմատության համար այս պահին մեծ բանավեճ է Ռուսաստամում նմանատիպ կորպուսների ընդհանուր ծավալի բավարարության շուրջ։ Ռուսաստանցի ծրագրավորղները չափազանց դժգոհում են, որ ներկա պահին նրա ծավալը կազմում է 4000 ժամ։ Կարծում եմ հարկ չկա նշել, թե ինչ չափերի են հասնում անգլերեն կամ չինարեն կորպուսները։
Սա մեր դառն իրականությունն է։ Այն աստիճանի զավեշտալի, որ արդեն մեր արտասահմանյան գործընկերները անթաքույց հեգնում են, թե ինչու են ՀՀ առաջին դեմքերը ամպագորգոռ հայտարարություններ անում արհեստական բանականության թեմաներով, երբ այդ բանականության կարևորագույն գործիքների հարցում մենք դեռ զերոյական վիճակում ենք։
Այնումենայնիվ, մենք լավ նորություններ ունենք ազգային կորպուսների հետ կապված։ Մեր կողմից մշակվել է մեխանիզմ, որը թույլ է տալիս օրական մինչև 30 ժամանոց կորպուս կառուցել մեծապես ավտոմատ ճանապարհով։
Այնպես որ հույս կա, որ այս տարվա ընթացքում կարող ենք հասնել գոնե Ռուսաստանի մակարդակին։ Մեծ հույսեր ենք կապում մի կրթական նախագծի հետ, որը երիտասարդական ավյուն կբերի մեր նախաձեռնություն։ Համագործակցության հաստատումից հետո մենք կներկայացնենք բոլոր մանրամասնությունները։