Skip to main content
Knowledge Centre on Translation and Interpretation

SCIC iniciatyvos kalbos technologijų srityje

SCIC projektai

Sakytinės kalbos atpažintis – sakytinės kalbos pavertimas rašytine

2020 m. pradžioje SCIC paskelbė apie bandomąjį projektą „Speech to Text“ (S2T, sakytinės kalbos pavertimas rašytine), kuriuo siekiama sukurti savo reikmėms skirtą sakytinės kalbos atpažinties sprendimą, pagrįstą naujausia dirbtinio intelekto ir natūraliosios kalbos apdorojimo srities raida. Per tą laiką, padedant SCIC vertėjams žodžiu, padaryta didelė pažanga. SCIC naudoja „Microsoft Azure“ – dabartinį Komisijos debesijos sprendimą, kuris teikia stardartinę kalbos atpažinties paslaugą transkripcijoms parengti, kurias vėliau įvertina savanoriai vertėjai žodžiu. Jie ištaiso visas klaidas, o peržiūrėta transkripcija vėl grąžinama į modelį, siekiant padidinti tikslumą; taip mašina „mokosi“ ir tobulėja.


Prie šio projekto ekspertinėmis savo kalbų žiniomis prisidėjo kolegos iš 23 vertimo žodžiu kabinų. Jie tikrino ir tvirtino „Microsoft Azure“ parengtas automatines transkripcijas atitinkamomis savo kalbomis. Tai užtikrina daugiakalbį projekto pobūdį ir padeda SCIC įsitvirtinti kaip pagrindiniam veikėjui EK, vykdančiam su kalba susijusią veiklą.

Baigus pradinę bandomąją fazę, projekte dalyvaujančių vertėjų skaičius pamažu augo, o šiuo metu projektas jau įgyvendinamas visu pajėgumu. Kadangi vertėjai žodžiu tikrina automatinę transkripciją, jie turi tekstą pamatyti visiškai kitomis akimis. Pavyzdžiui, jie turėjo išmokti nepaisyti skyrybos, didžiųjų raidžių, brūkšnelių rašymo taisyklių, nes transkripcija šiuo etapu gaunama visiškai neapdorota. Atrodo, kad tai prieštarauja kalbos specialistų intuicijai, tad persiorientuoti nebuvo paprasta.

Kiekvieną savaitę savanoriai susitinka ir aptaria sunkumus, su kuriais susidūrė. Diskutuojama įvairiais transkripcijų klausimais, o tai padeda tobulinti visiems dalyviams prieinamas transkripcijos gaires. Mašinos pasiūlyti „perliukai“, tokie kaip nuolat pasikartojantis žodis „Applebee“ graikiškame tekste ar transkripcijoje portugalų kalba išnyrantis „Brad Pitt“, diskusijoms suteikia žaismingumo. Šiuo metu mašininių transkripcijų kokybė kai kuriomis kalbomis geresnė nei kitomis, kartais atrandama labai juokingų transkripcijos variantų, pvz., „comissioner Wojciechowski“ perrašoma kaip „commissioner virtual husky“, „charity“ kaip „cherry tea“, „Brexit“ kaip „backseat“, o „to fill in the cows“ kaip „to fill up vacancies“. Suprantama, mašinai tobulėjant tokių juoką keliančių klaidų bus vis mažiau.

Vis dėlto tam, kad vertėjai žodžiu turėtų ką patvirtinti, reikia atlikti daug nematomo darbo. Reikia atsisiųsti, parengti ir į „Microsoft Azure“ įkelti didelės apimties garso rinkmenas. Tai atlieka techninės grupės, taip pat kai kurie specialiai tam parengti vertėjai žodžiu. Nereikia nė sakyti, kad bet kokiame projekte, kuriame dalyvauja tokia didelė žmonių grupė, labai svarbu derinti veiksmus. Tuo užsiėmė trys vertėjai žodžiu iš rumunų, nyderlandų ir portugalų kabinų. Tam tikra prasme jie veikia kaip techninės grupės ir savanorių vertėjų žodžiu jungtis. Jie taip pat atsakingi už darbo paketų siuntimą kolegoms, atsakymus į jų klausimus ir pagalbą kilus problemoms. Patvirtinę mašininę transkripciją, kolegos koordinatoriams siunčia pastabas dėl padarytų pataisų, o šie apie jas informuoja techninę grupę.

Vienas įdomiausių grupės atradimų buvo pamatyti, kaip sistema elgiasi ir kaip ją plėtoti. Vertėjai žodžiu tai apibūdino kaip daugiakalbio vaiko mokymą elementarių dalykų, pvz., nemaišyti kalbų; tačiau šiam vaikui „robotui“ taip pat reikia suteikti laisvę vystytis pačiam. Mašina išmoksta susitvarkyti su sudėtingomis vietomis, pasitaisyti, nuolat tobulinti savo technikas ir nekartoti tų pačių klaidų.

Tai į ateitį orientuotas proveržio projektas, nes atveria naujų perspektyvų, ypač klausos sutrikimų turintiems asmenims. Jis leis sukurti daug įvairių naudingų ir konkrečių taikomųjų programų, reikalingų ne vien Europos Komisijai (pvz., spaudos konferencijų automatinių subtitrų pavidalu), bet taip pat, ilgalaikėje perspektyvoje, pateiks sprendimų, pritaikytų Europos piliečiams. Viena pagrindinių projekto varomųjų jėgų yra siekis padaryti šią medžiagą prieinamą neįgaliesiems.