Skip to main content
Knowledge Centre on Translation and Interpretation

Pobude GD za tolmačenje na področju jezikovnih tehnologij

Projekti GD za tolmačenje

Prepoznavanje govora – pretvorba govora v besedilo

GD za tolmačenje je na začetku leta 2020 napovedal pilotni projekt – Pretvorba govora v besedilo – za razvoj skupne rešitve za prepoznavanje govora, ki bo temeljila na najnovejših dosežkih na področju umetne inteligence in obdelave naravnega jezika. Zaradi prispevka tolmačev GD za tolmačenje je bil od takrat dosežen velik napredek. GD za tolmačenje uporablja Microsoft Azure – rešitev v oblaku, ki jo trenutno uporablja Komisija in ki zagotavlja standardno storitev prepoznavanja govora –, da ustvarja zapise, ki jih nato ocenijo prostovoljni tolmači. Morebitne napake se popravijo in pregledan zapis se vrne v model, da se izboljša njegova natančnost, orodje pa se tako uči in izboljšuje.


V projektu so s svojim jezikovnim strokovnim znanjem sodelovali kolegi iz 23 kabin: v svojih jezikih so preverjali in potrjevali avtomatizirane zapise, ki jih je ustvaril Microsoft Azure. To zagotavlja večjezično naravo projekta in prispeva k uveljavitvi GD za tolmačenje kot ključni akter na področju govornih dejavnosti v Evropski komisiji.

Število tolmačev, ki sodelujejo v projektu, se je po začetni pilotni fazi postopno povečalo in projekt je zdaj v polnem teku. Ker tolmači preverijo avtomatiziran zapis, morajo na besedilo gledati drugače. Naučiti se morajo na primer, kako prezreti ločila, velike začetnice in vezaje, saj je zapis na tej točki „gol‟. Jezikovnim strokovnjakom se to zdi protislovno in prehod ni bil enostaven.

Prostovoljci se vsak teden sestanejo in razpravljajo o vprašanjih, s katerimi se srečujejo pri delu. Razprave zajemajo različna vprašanja v zvezi z zapisi in pomagajo pri izboljšanju smernic za zapisovanje, ki so na voljo vsem sodelujočim. Biseri, ki jih ustvari orodje, kot je večkratno omenjanje družbe Applebee v grškem besedilu ali Brada Pitta v portugalskem zapisu, dodajo razpravam lahkoten ton. Za zdaj orodje v nekaterih jezikih deluje bolje kot v drugih, pri čemer je ustvarilo nekaj zelo duhovitih zapisov, npr. „commissioner virtual husky‟ namesto „commissioner Wojciechowski‟, „cherry tea‟ namesto „charity‟, „backseat‟ namesto „Brexit‟ ali „to fill in the cows“ namesto „to fill up vacancies‟. Z izboljšanjem orodja bo humornih napak seveda manj in bodo vse redkejše.

Da pa bi tolmači imeli kaj potrditi, se v ozadju še veliko dogaja. Prenesti in pripraviti je treba obsežne avdiodatoteke, da se naložijo v Microsoft Azure. To je naloga tehničnih ekip in določenega števila posebej usposobljenih tolmačev. Seveda pa vsak projekt, ki vključuje tako veliko skupino ljudi, zahteva veliko usklajevanja, ki so se ga lotili trije tolmači iz romunske, nizozemske in portugalske kabine. Ti delujejo kot nekakšni posredniki med tehnično ekipo in prostovoljnimi tolmači. Odgovorni so tudi za pošiljanje delovnih paketov kolegom, odgovarjanje na njihova vprašanja in pomoč pri vseh težavah, na katere naletijo. Kolegi najprej potrdijo zapis, ki ga je ustvarilo orodje, nato pa svoje pripombe v zvezi z vnesenimi popravki pošljejo koordinatorjem, ki o tem poročajo tehnični ekipi.

Eno od najbolj zanimivih dognanj ekipe je bil način delovanja in razvoja sistema; tolmači so ga opisali kot poučevanje večjezičnega otroka osnovnih stvari, na primer da ne meša jezikov, tako da se mu hkrati pušča svoboda, da se razvija sam. Orodje se nauči spopadati s težjimi deli, popravljati samo sebe, nenehno izpopolnjevati svojo tehniko in ne ponavljati istih napak.

Gre za v prihodnost usmerjen projekt in preboj v smislu priložnosti, ki jih ponuja, zlasti za gluhe. Vodil bo k razvoju cele vrste zelo koristnih in konkretnih uporab, ne le v Evropski komisiji, na primer v obliki samodejnih podnapisov na tiskovnih konferencah, temveč bo dolgoročno ponujal tudi prilagojene rešitve za evropske državljane. Eno od glavnih gonil projekta je zagotoviti dostopnost gradiva za invalide.