Գիտնականները ստեղծել են տեխնոլոգիա, որը կարող է վերարտադրել կանացի բնական զգացմունքային խոսքը
Advertisement 1000 x 90

Գիտնականները ստեղծել են տեխնոլոգիա, որը կարող է վերարտադրել կանացի բնական զգացմունքային խոսքը

Բրիտանական Sonantic ընկերությունը Youtube-ում «Ո՞րն է նրա գաղտնիքը» վերնագրով 2 րոպե տևողությամբ տեսահոլովակ է հրապարակել, որը կարճ ժամանակահատվածում մեծ տարածում է գտել սոցիալական ցանցերում։ Կադրում մի աղջիկ է, ով լուռ է և խորհրդավոր ժպտում է, իսկ հետին պլանում հնչում է կանացի ձայն՝ գրավիչ ու գեղեցիկ արտասանությամբ։ Թվում է, թե սա սովորական տեսահոլովակ է, բայց վերջում ձայնը հանկարծակի հայտարարում է՝ «Ես իրական չեմ: Ես երբեք չեմ ծնվել և չեմ մեռնի, որովհետև գոյություն չունեմ» (1․08 րոպեից):

Տեսահոլովակը Sonantic-ի նոր տեխնոլոգիայի ցուցադրությունն է, որը նեյրոնային ցանցի միջոցով նմանակում է կանացի ձայնը՝ ներառյալ շնչառությունը, խոսքի դադարները, առոգանությունը, հնչերանգը, ծիծաղը, երկչոտությունը և այլն։ Տեխնոլոգիան արդեն կիրառվում է համակարգչային խաղերում և այլ ոլորտներում։

Ձայնի կրկնօրինակման այս տեխնոլոգիան Sonantic ընկերությունը սկսել է մշակել 2020 թվականից։ Սկզբնական տարբերակում ԱԲ-ի կողմից ստեղծված ձայնը բավականաչափ բնական չէր հնչում, և առկա էին որոշակի աղավաղումներ։

Թիմը շարունակեց բարելավել նեյրոնային ցանցը, և 2021 թվականին հայտնեց զգալի ձեռքբերումների մասին։ Մշակողները կարողացել են այս տեխնոլոգիան այնքան զարգացնել, որ այն օգտագործվել է դերասան Վել Քիլմերի ձայնը նմանակելու համար։ Մի քանի տարի առաջ դերասանի մոտ կոկորդի քաղցկեղ ախտորոշեցին և վիրահատությունից հետո նա կորցրեց խոսելու ունակությունը։ Sonantic-ի տեխնոլոգիան օգնեց նրան կրկին արտահայտել իր մտքերը և դերասանը գոհ էր մնացել իր վերստեղծված ձայնից։

Ներկայումս այս տեխնոլոգիան հնարավոր է կիրառել ամենատարբեր ոլորտներում՝ ֆիլմերի ու մուլտֆիլմերի արտադրությունից մինչև տեսախաղերի ստեղծում։ Հնարավոր է, որ ապագայում այս տեխնոլոգիան հայտնվի բջջային հեռախոսներում և «խելացի» բարձրախոսներում։

Ծրագրում հնարավոր է փոխել բառերի արտասանության արագությունը, կարգավորել ինտոնացիան և բառերի միջև ավելացնել օժանդակ հնչյուններ։ Խոսքը, մասնավորապես, հոգոցների, ծիծաղի և մարդկային բնական խոսքի այլ նուրբ նրբությունների մասին է։

Սինթեզատորն ակնհայտորեն շատ ավելի լավ է աշխատում, քան Google-ի և Yandex-ի անալոգները, սակայն այն դեռևս հասանելի է միայն մշակողներին և որոշ հաճախորդների։

Եթե այս տեխնոլոգիան մատչելի գնով հասանելի դառնա հանրությանը կամ ունենա համարժեք անալոգներ, կարող են մեծ փոփոխություններ լինել մուլտֆիլմերի և համակարգչային խաղերի ձայնային հնչյունների ոլորտում։ Գրեթե բոլորը կկարողանան ինքնուրույն թարգմանել և թողարկել իրենց սիրելի անիմացիոն ֆիլները և չսպասել այն օրվան, երբ կհայտնվի պրոֆեսիոնալ դերասանների կողմից կրկնօրինակված տարբերակը։

Ընդհանուր առմամբ, արհեստական ​​բանականությունը ժամանակի ընթացքում ավելի ու ավելի լավ է տիրապետում մարդկային հմտություններին։

Հրապարակման պատրևաստեց ita.am