Rikonoxximent tad-diskors - Traskrizzjoni Awtomatika tat-Taħdit
Fil-bidu tal-2020, l-SCIC ħabbar proġett pilota - Traskrizzjoni Awtomatika tat-Taħdit (S2T - Speech to Text) - biex tiġi żviluppata soluzzjoni ta’ rikonoxximent tad-diskors korporattiv li xprunat l-aħħar avvanzi fl-intelliġenza artifiċjali u l-ipproċessar tal-lingwa naturali. Minn dak iż-żmien ’l hawn sar ħafna progress, grazzi għall-kontribut tal-interpreti tal-SCIC. L-SCIC juża Microsoft Azure – is-soluzzjoni attwali tal-cloud fil-Kummissjoni li tipprovdi servizz standard ta’ rikonoxximent tad-diskors - biex toħloq traskrizzjonijiet, li wara jiġu vvalutati minn interpreti voluntiera. Kwalunkwe żball jiġi kkoreġut u t-traskrizzjoni riveduta tiddaħħal lura fil-mudell biex tittejjeb il-preċiżjoni tagħha, u b’dan il-mod il-magna “titgħallem” u ssir aħjar.
Kollegi mit-23 kabina pparteċipaw fil-proġett bl-għarfien espert lingwistiku tagħhom: huma vverifikaw u vvalidaw it-traskrizzjonijiet awtomatizzati fil-lingwi rispettivi tagħhom prodotti minn Microsoft Azure. Dan jiżgura n-natura multilingwi tal-proġett u jikkontribwixxi biex l-SCIC jistabbilixxi lilu nnifsu bħala attur ewlieni fil-qasam tal-attivitajiet tad-diskors fi ħdan il-KE.
Wara l-fażi pilota inizjali, l-għadd ta’ interpreti li jaħdmu fuq il-proġett ġie estiż gradwalment u l-proġett issa miexi b’ritmu tajjeb. Peress li l-interpreti jivverifikaw it-traskrizzjoni awtomatika, jeħtieġ li jaraw it-test b’sett ġdid ta’ għajnejn għalkollox. Pereżempju, huma kellhom jitgħallmu kif jinjoraw il-punteġġatura, l-ittri kapitali, u l-hyphens hekk kif it-traskrizzjoni f’dan l-istadju toħroġ “mikxufa”. Dan jinħass kontrointuwittiv għall-professjonisti tal-lingwa u l-bidla ma kinitx faċli.
Kull ġimgħa, il-voluntiera “jiltaqgħu” biex jiddiskutu kwistjonijiet li jiltaqgħu magħhom fuq xogħolhom. Id-diskussjonijiet ikopru firxa wiesgħa ta’ kwistjonijiet ta’ traskrizzjoni u jgħinu fit-titjib tal-linji gwida dwar it-traskrizzjoni disponibbli għall-parteċipanti kollha. L-istramberiji tad-daħk prodotti mill-magna, bħal pereżempju meta titfaċċa Applebee ripetutament f’test Grieg jew Brad Pitt fi traskrizzjoni Portugiża, iżidu dik il-pinzellata ċajtiera mad-diskussjonijiet. Għalissa l-magna taħdem aħjar f’xi lingwi minn oħrajn, u ħarġet b’xi traskrizzjonijiet tad-daħk ħafna, bħat-traskrizzjoni ta’ “commissioner Wojciechowski” “commissioner virtual husky” u “charity” bħala “cherry tea”, jew traskrizzjoni tal-Brexit bħala “backseat”, jew “to fill in the cows” għal “to fill up vacancies”. Hekk kif il-magna naturalment issir aħjar, l-iżbalji umorużi se jkunu inqas u ħafna aktar imbegħdin bejn wieħed u ieħor.
Madankollu, biex l-interpreti jkollhom xi ħaġa x’jivvalidaw, hemm ħafna attività wara l-kwinti. Audio files kbar jeħtieġ li jiġu ddawnlowdjati, imħejjija u applowdjati f’Microsoft Azure. Dan isir mit-timijiet tekniċi, kif ukoll minn xi interpreti mħarrġa apposta. M’hemmx għalfejn ngħidu, kwalunkwe proġett li jinvolvi grupp daqshekk kbir ta’ nies jeħtieġ ħafna koordinazzjoni, li qiegħda ssir minn tliet interpreti, mill-kabini Rumeni, Olandiżi u Portugiżi rispettivament. Huma jaġixxu bħala l-interface sa ċertu punt, bejn it-tim tekniku u l-interpreti voluntiera. Huma responsabbli wkoll biex jibagħtu l-pakketti ta’ ħidma lill-kollegi, iwieġbu l-mistoqsijiet tagħhom u jgħinu fi kwalunkwe problema li jistgħu jiltaqgħu magħha. Wara l-validazzjoni tat-traskrizzjoni magħmula mill-“magna”, il-kollegi jibagħtu lura l-kummenti tagħhom dwar il-korrezzjonijiet li introduċew lill-koordinaturi, li mbagħad jirrapportaw dan lit-tim tekniku.
Waħda mill-aktar skoperti eċċitanti għat-tim kienet li wieħed jara kif taħdem is-sistema u kif tista’ tevolvi; l-interpreti ddeskrivewha bħala li qisek qed tgħallem lil tifel multilingwi affarijiet bażiċi bħal li ma jħallatx il-lingwi, iżda wkoll li jħallu lil dan it-tifel ‘robot’ il-libertà tiegħu li jevolvi waħdu. Il-magna titgħallem tlaħħaq mal-partijiet diffiċli, tikkoreġi lilha nnifisha, tirfina t-teknika tagħha b’mod kostanti u ma tirrepetix l-istess żbalji.
Huwa proġett orjentat lejn il-futur u pass kbir ’il quddiem f’termini tal-prospett li joffri, speċjalment għal dawk neqsin mis-smigħ. Dan se jwassal għal firxa sħiħa ta’ applikazzjonijiet utli u konkreti ħafna, mhux biss fil-Kummissjoni Ewropea kollha, pereżempju, fil-forma ta’ sottotitli awtomatizzati f’konferenzi stampa, iżda wkoll, fuq medda twila ta’ żmien, billi joffri soluzzjonijiet imfassla apposta liċ-ċittadini Ewropej. Wieħed mill-muturi ewlenin tal-proġett huwa li l-materjal isir aċċessibbli għall-persuni b’diżabbiltà.