Beszéd- és szövegfelismerés
A SCIC 2020 elején bejelentette, hogy kísérleti projektet indít vállalati beszédfelismerő alkalmazás kidolgozására. A tervek szerint az alkalmazásnak a mesterséges intelligencia és a természetesnyelv-feldolgozás terén elért legújabb eredményekre kellett épülnie. A kezdeményezés azóta nagy léptekben halad előre, ami részben a SCIC tolmácsainak köszönhető: önkéntes tolmácsok ellenőrzik az automatikus beszédfelismerő programmal készült átiratokat, javítják ki a hibákat, és táplálják vissza a javított átiratot a beszédfelismerő modellbe. A SCIC a Bizottság felhőplatformját, a Microsoft Azure-t, és annak standard beszédfelismerő programját használja, amely a folyamat révén „tanul”, azaz egyre pontosabbá és hatékonyabbá válik.
A többnyelvű projektben 23 nyelv tolmácsai vesznek részt: saját nyelvükön ellenőrzik és hagyják jóvá a Microsoft Azure által automatikusan elkészített átiratokat. A projekt jóvoltából a SCIC az Európai Bizottság egyik legfontosabb szereplője a beszéddel kapcsolatos tevékenységeket illetően.
A kezdeti, kísérleti szakaszt követően a projekten dolgozó tolmácsok száma fokozatosan bővült. A projekt jelenleg gyors ütemben halad. Az automatikus átirat ellenőrzéséhez a tolmácsoknak meg kellett tanulniuk új szemmel nézni a szövegre, ami az elején nem volt könnyű. Nem volt például természetes számukra, hogy elvonatkoztassanak a központozás hiányától, mivel az átiratokban nincsenek pontok, vesszők, nagy kezdőbetűk, kötőjelek.
Az önkéntesek minden héten összeülnek, hogy megvitassák az átírás során felmerülő problémákat, és javítsák a meglévő átírási iránymutatásokat. A megbeszélések olykor derűs hangnemben zajlanak, mert az alkalmazás többször is az Applebee szót véli felfedezni a görög szövegekben, vagy indokolatlanul hivatkozik Brad Pittre a portugál átiratban. A beszédfelismerő program bizonyos nyelveken jobban teljesít mint másokon, és előfordulnak további vicces félreértések is: angolul például a commissioner Wojciechowski szókapcsolatot commissioner virtual husky-nak, a charity szót cherry tea-nek, a Brexit betűszót backseat-nek, a to fill in the cows kifejezést pedig to fill up vacancies-nek értelmezi. A program fejlődésével azonban ezek a mulatságos hibák egyre ritkábbak lesznek.
Ahhoz azonban, hogy a tolmácsok jóváhagyhassanak egy-egy átiratot, bizonyos előkészületekre van szükség. Technikai munkatársaink és néhány, erre külön kiképzett tolmács gondoskodnak arról, hogy a nagy audiofájlokat letöltse, előkészítse és feltöltse a Microsoft Azure-ba. Egy ilyen sok embert érintő projekthez természetesen koordinátorra is szükség van – ezt a feladatot a román, a holland és a portugál nyelvi csoport egy-egy tolmácsa tölti be. Feladatuk, hogy bizonyos mértékig összekötő szerepet töltsenek be a technikai munkacsoport és az önkéntes tolmácsok között: továbbítják a munkafájlokat a kollégáknak, megválaszolják kérdéseiket és segítséget nyújtanak az esetlegesen felmerülő problémák során. Miután a tolmácsok jóváhagyják a gép által készített átiratot, észrevételeiket elküldik a koordinátoroknak, akik továbbítják azokat a technikai munkacsoportnak.
A csoport egyik legizgalmasabb tevékenysége annak megfigyelése, hogyan viselkedik és miképpen fejleszthető a rendszer. A tolmácsok szerint ahhoz hasonlítható a folyamat, amikor egy többnyelvű gyermeknek alapvető dolgokat tanítunk meg, például hogy ne keverje a nyelveket, ugyanakkor teret adunk a „robot” gyermek önálló fejlődésének is. A gép megtanulja, hogy megbirkózzon a nehéz részekkel, kijavítsa önmagát, folyamatosan finomítsa technikáját és ne essen bele ugyanazokba a hibákba.
Olyan jövőorientált projektről van szó, amely hatalmas áttörést hozhat a témában, és amelyből elsősorban a hallássérültek húzhatnak hasznot. A projekt eredményeképpen nagyon hasznos és konkrét alkalmazások születhetnek nemcsak az Európai Bizottságon belül (gondoljunk csak a sajtókonferenciák automatizált feliratozására), de hosszabb távon másutt is, pl. személyre szabott megoldások kínálhatók az európai polgárok számára. A projekt egyik fő célja az, hogy a fogyatékossággal élő személyek is hozzáférjenek az írott anyagokhoz.