Skip to main content
Knowledge Centre on Translation and Interpretation

Iniciativy GŘ SCIC v oblasti jazykových technologií

Projekty GŘ SCIC

Převod řeči na text – Speech-to-text

Začátkem roku 2020 oznámilo GŘ pro tlumočení (GŘ SCIC) zahájení pilotního projektu s názvem Speech to Text (S2T), který se zaměřuje na vývoj interního nástroje k převodu řeči na text při zohlednění nejnovějšího vývoje v oblasti umělé inteligence a zpracování přirozeného jazyka. Od té doby bylo díky zapojení tlumočníků GŘ SCIC dosaženo značného pokroku. GŘ SCIC využívá současné cloudové řešení Komise Microsoft Azure, které zajišťuje standardní převod řeči na text (speech recognition), a to k vytváření přepisů mluveného slova. Transkripty pak posoudí skupina interních tlumočníků, kteří se k tomuto úkolu dobrovolně přihlásili, a opraví veškeré chyby. Přepracovaný text se pak vkládá zpět do programu, aby se zvýšila jeho přesnost. Program se tak „učí“ a zlepšuje.


Projektu se zúčastnili kolegové z 23 tlumočnických kabin, přičemž každá zastupuje jeden jazyk. Díky svým lingvistickým znalostem mohli ve svém jazyce zkontrolovat a validovat automatizované transkripty vypracované programem Microsoft Azure. Tím se zajistila mnohojazyčnost projektu a GŘ SCIC tak získalo klíčovou roli v aktivitách Evropské komise souvisejících se zpracováním mluveného slova.

Po počáteční pilotní fázi se počet tlumočníků, kteří se na projektu podílejí, postupně zvyšoval a projekt je nyní v plném provozu. Když tlumočníci automatizovaný přepis kontrolují, musí se na daný text dívat ze zcela jiného úhlu. Musí se například naučit, jak nevnímat interpunkci, velká písmena a spojovníky, neboť v této fázi má přepis pouze hrubou podobu. To lingvisté vnímají jako rušivé, a proto pro ně není snadné si na tuto formu zvyknout.

Každý týden se dobrovolníci setkávají a diskutují o problémech, s nimiž se během své práce setkali. Diskuse se týkají široké škály otázek transkripce a přispívají tak k optimalizaci pokynů pro přepis, které pak mají všichni účastníci k dispozici. Na přetřes přijdou i přepisové „perly“, které program vytváří, jako například opakované Applebee v řeckém přepisu nebo Brad Pitt v portugalské transkripci. Přepisový software funguje v současné době v některých jazycích lépe než v jiných. Někdy vytváří až komické přepisy, např. přepis „komisaře Wojciechowského“ na „komisaře virtual husky“, slovo „charity“ zaznamenal jako „cherry tea“ a „brexit“ jako „back seat“. S tím, jak se program učí, se budeme s humornými chybami setkávat stále méně často.

Aby měli tlumočníci co ověřovat, je třeba předtím realizovat několik kroků. Nejprve je třeba stáhnout velké množství audiosouborů. Ty se připraví a nahrají do programu Microsoft Azure. O to se starají technické týmy a někteří speciálně vyškolení tlumočníci. Podobně jako u jiných rozsáhlých projektů, do nichž je zapojen větší počet lidí, je třeba i zde vše náležitě koordinovat. To zajišťují tři tlumočníci z rumunské, nizozemské a portugalské kabiny. Fungují do jisté míry jako prostředníci mezi technickým týmem a tlumočníky, kteří přepisy kontrolují. Zároveň mají na starost zasílání pracovních souborů tlumočníkům ke kontrole, zodpovídání jejich dotazů a pomoc v případě potíží. Po validaci automatizovaného transkriptu zašlou tlumočníci koordinátorům své připomínky k opravám, které v textu provedli. Ti pak příslušné postřehy oznámí technickému týmu.

Tím nejzajímavějším pro celý tým bylo sledovat, jak se systém chová a jak se může dále rozvíjet. Tlumočníci to popsali takto: je to, jako když učíte vícejazyčné dítě základní věci, jako třeba nemíchat více jazyků dohromady – zároveň mu ale dáváte svobodu se rozvíjet. Program se postupně učí, jak se lépe vypořádat s obtížnými pasážemi, opravovat vlastní chyby. Neustále zdokonaluje svou techniku a snaží se vyvarovat stejných chyb.

Jde o projekt orientovaný na budoucnost, který má obrovský potenciál i v jiných oblastech využití, zvláště pro neslyšící. Uplatnit se může v mnoha zcela konkrétních případech, a to nejen v celé Evropské komisi (např. v podobě automatizovaných titulků na tiskových konferencích) – v dlouhodobějším horizontu nabídne také individualizovaná řešení, z nichž budou mít prospěch evropští občané. Vidina toho, že tento nástroj může jednou posloužit lidem se zdravotním postižením, je jedním z hlavních hnacích motorů projektu.