Rozpoznávanie reči – prevod reči na text
Začiatkom roka 2020 GR SCIC oznámilo pilotný projekt – Prevod reči na text (S2T) – s cieľom vyvinúť podnikové riešenie v oblasti rozpoznávania reči, pri ktorom sa využívajú najnovšie pokroky v oblasti umelej inteligencie a spracovania prirodzeného jazyka. Odvtedy sa vďaka prínosu tlmočníkov GR SCIC dosiahol veľký pokrok. GR SCIC využíva Microsoft Azure – súčasné cloudové riešenie v Komisii, ktoré poskytuje štandardnú službu rozpoznávania reči – na vytváranie prepisov, ktoré následne posudzujú dobrovoľní tlmočníci. Akékoľvek chyby sa opravia a upravený prepis sa vráti späť do modelu, aby sa zlepšila jeho presnosť, a týmto spôsobom sa stroj „učí“ a zlepšuje sa.
Na projekte sa svojimi jazykovými znalosťami podieľali kolegovia z 23 kabín: overovanie a potvrdenie automatických prepisov vytvorených platformou Microsoft Azure v ich príslušných jazykoch. Zabezpečuje sa tým viacjazyčný charakter projektu a prispieva k tomu, že GR SCIC sa etabluje ako kľúčový hráč v oblasti rečových aktivít v rámci EK.
Počet tlmočníkov pracujúcich na projekte sa po úvodnej pilotnej fáze postupne rozširoval a projekt je teraz naplno rozbehnutý. Tlmočníci musia pri overovaní automatického prepisu vidieť text úplne novými očami. Museli sa napríklad naučiť ignorovať interpunkciu, veľké písmená a spojovníky, pretože prepis v tejto fáze vychádza „nahý“. Pre jazykových odborníkov je to kontraintuitívne a posun nebol jednoduchý.
Dobrovoľníci sa každý týždeň „stretávajú“, aby prediskutovali problémy, s ktorými sa stretávajú počas svojej práce. Diskusie pokrývajú širokú škálu problémov s prepisom a pomáhajú zlepšovať usmernenia týkajúce sa prepisov dostupné pre všetkých účastníkov. Perličky, ktoré stroj vyprodukuje, ako je opakované uvedenie „Applebee“ v gréckom texte alebo Brad Pitt v portugalskom prepise, dodávajú diskusiám odľahčený nádych. V súčasnosti stroj funguje lepšie v niektorých jazykoch ako v iných a prišiel s niekoľkými veľmi zábavnými prepismi, ako napríklad prepis spojenia „komisár Wojciechowsky“ ako „komisár virtuálny husky“ a „charita“ ako „čerešňový čaj“ alebo prepis Brexitu ako „zadné sedadlo“ či „zaplniť kravy“ namiesto „zaplniť voľné miesta“. S postupným zlepšovaním stroja sa bude, samozrejme, vyskytovať oveľa menej vtipných chýb medzi nimi.
Avšak na to, aby mali tlmočníci čo potvrdzovať, je zákulisie plné aktivít. Veľké zvukové súbory je potrebné stiahnuť, pripraviť a nahrať do Microsoft Azure. Robia to technické tímy, ako aj niektorí špeciálne vyškolení tlmočníci. Netreba dodávať, že každý projekt zahŕňajúci takú veľkú skupinu ľudí si vyžaduje množstvo koordinácie, na ktorej sa podieľali traja tlmočníci z rumunskej, holandskej a portugalskej kabíny. Do určitej miery fungujú ako rozhranie medzi technickým tímom a dobrovoľnými tlmočníkmi. Takisto sú zodpovední za odosielanie pracovných balíkov kolegom, odpovedanie na ich otázky a pomoc s akýmkoľvek problémom, s ktorým sa môžu stretnúť. Po overení prepisu, ktorý vytvoril „stroj“, kolegovia pošlú späť svoje pripomienky týkajúce sa zavedených opráv koordinátorom, ktorí to následne nahlásia technickému tímu.
Jedným z najzaujímavejších objavov pre tím bolo vidieť, ako sa systém správa a ako dosiahnuť jeho vývoj; tlmočníci to opísali tak, že je to ako naučiť viacjazyčné dieťa základné veci, napríklad nemiešať jazyky, ale aj nechať tomuto „robotovému“ dieťaťu slobodu, aby sa samo vyvíjalo. Stroj sa učí zvládať náročné časti, korigovať sa, neustále zdokonaľovať svoju techniku a neopakovať tie isté chyby.
Ide o projekt orientovaný na budúcnosť a prelomový z hľadiska perspektívy, ktorú ponúka najmä pre sluchovo postihnutých. Výsledkom bude celý rad veľmi užitočných a konkrétnych aplikácií, a to nielen v rámci Európskej komisie, napríklad vo forme automatických titulkov na tlačových konferenciách, ale z dlhodobého hľadiska aj prostredníctvom ponuky prispôsobených riešení pre európskych občanov. Sprístupňovanie materiálov pre osoby so zdravotným postihnutím je jednou z hlavných hnacích síl projektu.