Skip to main content
Knowledge Centre on Translation and Interpretation

Инициативи на SCIC в областта на езиковите технологии

Проекти на SCIC

Разпознаване на реч — преобразуване на реч в текст

В началото на 2020 г. SCIC обяви пилотен проект — Speech to Text (S2T) — за разработване на институционално решение за разпознаване на реч, като се използват най-новите постижения в областта на изкуствения интелект и обработката на естествен език. Оттогава насам е постигнат значителен напредък благодарение на приноса на устните преводачи на SCIC. Чрез Microsoft Azure — облачната услуга, която се използва понастоящем в Комисията и има стандартна функция за разпознаване на реч — SCIC създава транскрипции, които след това се оценяват от устни преводачи доброволци. Всички грешки се коригират и преработените транскрипции се въвеждат отново в модела, за да се подобри неговата точност, и по този начин машината „учи“ и се подобрява.


Колеги от 23-те преводачески отдела участваха в проекта със своя езиков опит — те проверяваха и валидираха автоматични транскрипции на своите езици, създадени чрез Microsoft Azure. Така се гарантира многоезичният характер на проекта и се допринася за утвърждаването на SCIC като ключов участник в разработването на свързани с речта технологии в рамките на Европейската комисия.

След първоначалната пилотна фаза броят на устните преводачи, работещи по проекта, постепенно се увеличава и по проекта вече се работи с нормален ритъм. Когато устните преводачи проверяват автоматична транскрипция, те трябва да гледат на текста по съвършено нов начин. Например те трябваше да се научат да не обръщат внимание на пунктуацията, главните букви и тиретата, тъй като на този етап транскрипциите са в „груб“ вид. За езиковите специалисти това е нещо неестествено и не им бе лесно да свикнат.

Всяка седмица доброволците „се срещат“, за да обсъждат въпроси, които възникват по време на работата им. Дискусиите обхващат широк кръг от въпроси, свързани с транскрибирането, и помагат за подобряване на насоките, достъпни за всички участници. По време на обсъжданията не липсват и забавни моменти, свързани с бисери, като например появата на Брад Пит в автоматична транскрипция на португалски. За момента софтуерът за машинно транскрибиране работи по-добре на някои езици, отколкото на други, и понякога предлага някои много забавни транскрипции, като например „commissioner virtual husky“ вместо „commissioner Wojciechowski’“ (съответно „комисар виртуално хъски“ и „комисар Войчеховски“), „cherry tea“ вместо „charity“ (съответно „черешов чай“ и „благотворителност“), „backseat“ вместо „Brexit“ (съответно „задна седалка“ и „Брексит“) или „to fill in the cows“ вместо „to fill up vacancies“ (съответно „да се попълнят кравите“ вместо „да се попълнят свободните работни места“). С подобряването на софтуера, разбира се, подобни забавните грешки ще се срещат по-рядко.

Преди устните преводачи да започнат да валидират текстовете, се извършват много други дейности. Големи аудиофайлове трябва да бъдат изтеглени, подготвени и качени в Microsoft Azure. Това се прави от техническите екипи, както и от някои специално обучени устни преводачи. Разбира се, всеки проект, включващ толкова голяма група хора, изисква сериозна координация. С тази задача са се заели трима преводачи от румънския, нидерландския и португалския отдел. В известна степен те изпълняват ролята на посредник между техническия екип и преводачите доброволци. Те също така отговарят за изпращането на работните пакети до своите колеги, отговарят на техните въпроси и им помагат да се справят с всички проблеми, които възникват. След валидиране на машинна транскрипция преводачите изпращат на координаторите коментари относно своите корекции, а координаторите ги препращат на техническия екип.

Едно от най-вълнуващите неща за екипа е да види как функционира системата и как тя може да бъде развита. Устните преводачи описват това като обучаване на многоезично дете на основни неща, като как да не смесва езиците, но също така предоставяне на свобода на това дете „робот“ да се развива само. Системата се учи да се справя с трудните части, да се коригира, да подобрява непрекъснато техниката си и да не повтаря едни и същи грешки.

Това е ориентиран към бъдещето проект, който предлага изключителни перспективи, особено за хората с увреден слух. Той ще доведе до редица полезни и конкретни приложения не само в Европейската комисия (например под формата на автоматични субтитри по време на пресконференции), но и в дългосрочен план чрез предлагане на съобразени с конкретните нужди решения на европейските граждани. Осигуряването на достъп на хора с увреждания до различни материали е една от основните движещи сили на проекта.