Prepoznavanje govora – Speech-to-text
Početkom 2020. SCIC je najavio pilot-projekt Speech-to-text (S2T) za pretvaranje govora u tekst. Cilj je na razini Komisije razviti rješenje za prepoznavanje govora na temelju najnovijih dostignuća u području umjetne inteligencije i obrade prirodnog jezika. Zahvaljujući doprinosu usmenih prevoditelja SCIC-a otad je postignut velik napredak. SCIC koristi Microsoft Azure (rješenje u oblaku koje se trenutačno koristi u Komisiji i pruža standardnu uslugu prepoznavanja govora) za transkripciju, koju zatim ocjenjuju dobrovoljci među usmenim prevoditeljima. Nakon ispravljanja pogrešaka revidirana transkripcija vraća se u model kako bi se poboljšala njegova točnost. Na taj način stroj „uči” i postaje sve bolji.
Kolege iz 23 kabine pridonijeli su projektu svojim stručnim znanjem: provjerom i validacijom automatizirane transkripcije koju je proizveo Microsoft Azure na njihovim jezicima. Time se osigurava višejezičnost projekta i pridonosi pozicioniranju SCIC-a kao ključnog aktera u području govornih aktivnosti u Europskoj komisiji.
Nakon početne pilot-faze broj usmenih prevoditelja koji rade na projektu postupno se povećavao i projekt je sada u punom zamahu. Dok provjeravaju automatiziranu transkripciju, prevoditelji moraju gledati tekst novim očima. Na primjer, morali su naučiti kako zanemariti interpunkciju, velika slova i crtice jer je transkripcija u toj fazi potpuno „sirova”. Jezičnim stručnjacima to je sasvim neprirodno i nije se bilo lako na to naviknuti.
Svakog tjedna volonteri se sastanu i razgovaraju o problemima na koje nailaze u radu. Njihove rasprave obuhvaćaju razna pitanja povezana s transkripcijom i pomažu im da poboljšaju smjernice za transkripciju koje su dostupne svim sudionicima. Rasprave znaju razvedriti biseri koje izbaci stroj, kao što je često ponavljanje riječi Applebee u grčkom tekstu ili stalno iskrsavanje Brada Pitta u portugalskoj transkripciji. Stroj zasad na nekim jezicima daje bolje, na nekima lošije rezultate, a ima i vrlo zabavne transkripcije. Tako je „commissioner Wojciechowski” postao „commissioner virtual husky”, „charity” je transkribirano kao „cherry tea”, a „Brexit” je postao „backseat”. Kako se stroj bude poboljšavao, smiješnih će pogrešaka biti sve manje i bit će sve rjeđe.
No da bi usmeni prevoditelji imali što validirati, iza kulisa se mnogo toga događa. Velike audiodatoteke potrebno je preuzeti, pripremiti i poslati u Microsoft Azure. To rade tehnički timovi, kao i neki za to specijalizirani usmeni prevoditelji. Naravno, za svaki projekt na kojem radi toliko ljudi potrebno je mnogo koordinacije. Za to se pobrinulo troje prevoditelja, iz rumunjske, nizozemske i portugalske kabine. Oni su neka vrsta posrednika između tehničkog tima i volontera među usmenim prevoditeljima. Zaduženi su i za slanje radnih paketa kolegama, odgovaranje na njihova pitanja i pomoć ako bilo što zapne. Nakon validacije strojne transkripcije kolege šalju komentare o unesenim ispravcima koordinatorima, koji o tome izvješćuju tehnički tim.
Jedno od najuzbudljivijih otkrića za tim bilo je promatrati kako se sustav ponaša i kako se može utjecati na njegov razvoj; prevoditelji su to opisali kao da višejezično dijete uče osnovnim stvarima, npr. da ne miješa jezike, ali i da tom robotskom djetetu ostavljaju slobodu da se samostalno razvija. Stroj uči kako se nositi s teškim dijelovima, kako se ispraviti, stalno usavršavati svoju tehniku i ne ponavljati iste pogreške.
Riječ je o projektu koji je okrenut budućnosti i revolucionaran s obzirom na mogućnosti koje otvara, pogotovo za osobe oštećena sluha. Dovest će do niza vrlo korisnih i konkretnih aplikacija, ne samo u Europskoj komisiji, na primjer u obliku automatiziranih titlova na konferencijama za medije, nego i dugoročno tako što će europskim građanima ponuditi prilagođena rješenja. Pristupačnost materijala za osobe s invaliditetom jedan je od glavnih ciljeva ovog projekta.