Skip to main content
Knowledge Centre on Translation and Interpretation

Initiativen der GD Dolmetschen im Bereich der Sprachtechnologien

Projekte der GD Dolmetschen

Spracherkennung – Speech-to-Text

Anfang 2020 kündigte die GD Dolmetschen den Start des Pilotprojekts „Speech-to-Text“ (S2T) zur Umwandlung gesprochener Sprache in Text an. Ziel ist die Entwicklung einer kommissionsweiten Lösung für die Spracherkennung, bei der die jüngsten Fortschritte im Bereich der künstlichen Intelligenz und der Verarbeitung natürlicher Sprache genutzt werden. Dank des Beitrags der Dolmetscher/innen der GD Dolmetschen wurden seitdem große Fortschritte erzielt. Die GD Dolmetschen verwendet Microsoft Azure (die aktuelle Cloud-Lösung der Kommission, die einen Standarddienst der Spracherkennung umfasst) um Transkriptionen zu erstellen, die anschließend von Dolmetscher/innen bewertet werden, die sich freiwillig an diesem Projekt beteiligen. Etwaige Fehler werden korrigiert und die überarbeitete Transkription wird wieder in das Modell eingespeist, um die Genauigkeit zu verbessern. Auf diese Weise „lernt“ das System und verbessert sich ständig.


Kolleginnen und Kollegen aus den 23 Kabinen beteiligten mit ihrem sprachlichen Fachwissen an dem Projekt – sie haben die von Microsoft Azure erstellten automatisierten Transkriptionen in ihren jeweiligen Sprachen überprüft und validiert. Damit wird der mehrsprachige Charakter des Projekts gewährleistet und die GD Dolmetschen etabliert sich innerhalb der Europäischen Kommission als Schlüsselakteur im Bereich der Sprachtätigkeiten.

Nach der ersten Pilotphase wurde die Zahl der an dem Projekt mitarbeitenden Dolmetscher/innen schrittweise erhöht, und das Projekt hat nun volle Fahrt aufgenommen. Bei der Überprüfung der automatischen Transkription müssen die Dolmetscher/innen den Text auf völlig neue Weise betrachten. Sie mussten beispielsweise lernen, Zeichensetzung, Groß- und Kleinschreibung sowie Bindestriche zu ignorieren, da die Transkription in dieser Phase völlig „nackt“ ist. Dazu mussten sich die Sprachfachkräfte von ihrer intuitiven Betrachtungsweise lösen, was nicht einfach war.

Die freiwilligen Projektteilnehmenden „treffen sich“ einmal pro Woche, um die Punkte zu erörtern, auf die sie während ihrer Arbeit gestoßen sind. Dabei wird ein breites Spektrum von Transkriptionsfragen diskutiert und die Gespräche tragen dazu bei, die allen Teilnehmenden zur Verfügung stehenden Transkriptionsleitlinien zu verbessern. Von der Computersoftware produzierte „Juwelen“, beispielsweise das wiederholte Auftauchen von Applebee in einem griechischen Text oder Brad Pitt in einer portugiesischen Transkription, tragen zur Unterhaltung bei. Derzeit schneidet der Computer in einigen Sprachen besser ab als in anderen und es gab ein paar sehr lustige Transkriptionen. So wurde beispielsweise „Commissioner Wojciechowski“ in der Transkription zu „Commissioner Virtual Husky“ (Kommissionsmitglied virtueller Husky), „charity“ (Wohltätigkeitsorganisation) zu „cherry tea“ (Kirschtee), „Brexit“ zu „backseat“ (Rücksitz) oder „to fill up vacancies“ (Besetzung freier Stellen) zu „to fill in the cows“ (Ausfüllen von Kühen). Wenn die Computererkennung mit der Zeit immer besser wird, treten solche amüsanten Fehler weniger und seltener auf.

Damit die Dolmetscher/innen Material zum Validieren haben, sind jedoch zahlreiche Aktivitäten hinter den Kulissen notwendig. Große Audiodateien müssen heruntergeladen, aufbereitet und in Microsoft Azure hochgeladen werden. Dies wird von den technischen Teams sowie von einigen speziell geschulten Dolmetscher/innen durchgeführt. Natürlich erfordert jedes Projekt, an dem derart viele Personen beteiligt sind, eine ganze Menge an Koordinierung. Diese Arbeit haben drei Dolmetscher/innen der rumänischen, der niederländischen und der portugiesischen Kabine übernommen. Sie fungieren in gewissem Umfang als Schnittstelle zwischen dem technischen Team und den freiwilligen Dolmetscherinnen und Dolmetschern. Zudem sind sie dafür zuständig, die Arbeitspakete an die Kolleginnen und Kollegen zu senden, ihre Fragen zu beantworten und sie bei allen auftauchenden Problemen zu unterstützen. Nach der Validierung der automatisch erstellten Transkription senden die Kolleginnen und Kollegen ihre Anmerkungen zu den von ihnen vorgenommenen Korrekturen an die Koordinatorinnen und Koordinatoren zurück, die diese dann dem technischen Team melden.

Für das Team war es besonders spannend, zu sehen, wie sich das System verhält und wie es weiterentwickelt werden kann: Die Dolmetscher/innen haben dies als vergleichbar damit beschrieben, einem mehrsprachigen Kind grundlegende Dinge beizubringen, beispielsweise Sprachen nicht zu vermischen, aber dem „Roboterkind“ zugleich die Freiheit zu lassen, sich selbstständig weiterzuentwickeln. Der Computer lernt, die schwierigen Teile zu bewältigen, sich selbst zu korrigieren, seine Technik ständig zu verfeinern und nicht dieselben Fehler zu wiederholen.

Es handelt sich um ein zukunftsorientiertes Projekt und einen Durchbruch in Bezug auf die künftigen Möglichkeiten, die es insbesondere für Hörgeschädigte bietet. Das Projekt wird zu einer ganzen Reihe sehr nützlicher und konkreter Anwendungen führen, nicht nur für die gesamte Europäische Kommission (z. B. in Form automatisierter Untertitel bei Pressekonferenzen), sondern auch längerfristig im Sinne eines Angebots maßgeschneiderter Lösungen für die europäischen Bürgerinnen und Bürger. Eine der wichtigsten Triebkräfte des Projekts ist es, Materialien für Menschen mit Behinderungen zugänglich zu machen.