Skip to main content
Επίσημος ιστότοπος της Ευρωπαϊκής ΈνωσηςΕπίσημος ιστότοπος της ΕΕ
Knowledge Centre on Translation and Interpretation

Πρωτοβουλίες της SCIC στις γλωσσικές τεχνολογίες

Έργα SCIC

Αναγνώριση ομιλίας — Μετατροπή ομιλίας σε κείμενο

Στις αρχές του 2020 η SCIC ανακοίνωσε ένα πιλοτικό έργο —Μετατροπή ομιλίας κείμενο (S2T)— για την ανάπτυξη εταιρικής λύσης αναγνώρισης ομιλίας, το οποίο αξιοποίησε τις τελευταίες εξελίξεις στην τεχνητή νοημοσύνη και την επεξεργασία φυσικής γλώσσας. Έκτοτε έχει σημειωθεί μεγάλη πρόοδος, χάρη στη συμβολή των διερμηνέων της SCIC. Η SCIC χρησιμοποιεί το Microsoft Azure —την τρέχουσα λύση υπολογιστικού νέφους στην Επιτροπή, που παρέχει μια τυποποιημένη υπηρεσία αναγνώρισης ομιλίας— για τη δημιουργία μεταγραφών, οι οποίες στη συνέχεια αξιολογούνται από εθελοντές διερμηνείς. Τυχόν σφάλματα διορθώνονται και η αναθεωρημένη μεταγραφή επανεισάγεται στο μοντέλο για να βελτιωθεί η ακρίβειά του· κατ’ αυτόν τον τρόπο, η μηχανή «μαθαίνει» και βελτιώνεται.


Συνάδελφοι από τις 23 καμπίνες συμμετείχαν στο έργο με τη γλωσσική τους πείρα: επαληθεύοντας και επικυρώνοντας αυτοματοποιημένες μεταγραφές που παράγονται από το Microsoft Azure στις αντίστοιχες γλώσσες τους. Αυτό διασφαλίζει τον πολυγλωσσικό χαρακτήρα του έργου και συμβάλλει στην εδραίωση της SCIC ως βασικού παράγοντα στον τομέα των δραστηριοτήτων ομιλίας εντός της Ευρωπαϊκής Επιτροπής.

Μετά την αρχική πιλοτική φάση, ο αριθμός των διερμηνέων που εργάζονται στο έργο διευρύνθηκε σταδιακά και το έργο βρίσκεται πλέον σε πλήρη εξέλιξη. Καθώς οι διερμηνείς επαληθεύουν την αυτοματοποιημένη μεταγραφή, πρέπει να βλέπουν το κείμενο «με άλλο μάτι». Για παράδειγμα, χρειάστηκε να μάθουν πώς να αγνοούν τη στίξη, τα κεφαλαία γράμματα και τις παύλες, καθώς η μεταγραφή σε αυτό το στάδιο είναι «ανεπεξέργαστη». Αυτό ξενίζει τους επαγγελματίες του γλωσσικού κλάδου και η αλλαγή δεν ήταν εύκολη.

Κάθε εβδομάδα, οι εθελοντές «συναντώνται» για να συζητήσουν θέματα που αντιμετωπίζουν κατά τη διάρκεια της εργασίας τους. Οι συζητήσεις καλύπτουν ευρύ φάσμα θεμάτων μεταγραφής και συμβάλλουν στη βελτίωση των κατευθυντήριων γραμμών μεταγραφής που είναι διαθέσιμες σε όλους τους συμμετέχοντες. Τα «μαργαριτάρια» της μηχανής, όπως η επανειλημμένη χρήση της επωνυμίας Applebee σε ελληνικό κείμενο ή του ονόματος του ηθοποιού Brad Pitt σε πορτογαλική μεταγραφή, προσδίδουν έναν ανάλαφρο τόνο στις συζητήσεις. Επί του παρόντος, η μηχανή έχει καλύτερες επιδόσεις σε ορισμένες γλώσσες απ’ ό,τι σε άλλες και έχει παρουσιάσει ορισμένες πολύ αστείες μεταγραφές, όπως η μεταγραφή του «επιτρόπου Βοϊτσεχόφσκι» ως «επιτρόπου εικονικού χάσκι» και της «φιλανθρωπίας» ως «τσαγιού κερασιού», ή η μεταγραφή του Brexit ως «πίσω κάθισμα» ή μεταγραφή της φράσης «για την κάλυψη κενών θέσεων» ως «για την πλήρωση των αγελάδων». Καθώς η μηχανή βελτιώνεται, ασφαλώς τα χιουμοριστικά λάθη θα είναι λιγότερα και πολύ πιο αραιά.

Ωστόσο, για να έχουν οι διερμηνείς στη διάθεσή τους κάτι προς επικύρωση, υπάρχει μεγάλη δραστηριότητα στα παρασκήνια. Τα μεγάλα ηχητικά αρχεία πρέπει να τηλεφορτωθούν, να προετοιμαστούν και να αναφορτωθούν στο Microsoft Azure. Αυτό γίνεται από τις τεχνικές ομάδες, καθώς και από ορισμένους ειδικά καταρτισμένους διερμηνείς. Είναι αυτονόητο ότι κάθε έργο στο οποίο εμπλέκονται τόσα άτομα απαιτεί μεγάλο συντονισμό, ο οποίος έχει αναληφθεί από τρεις διερμηνείς, από τη ρουμανική, την ολλανδική και την πορτογαλική καμπίνα, αντίστοιχα. Οι εν λόγω διερμηνείς λειτουργούν σε κάποιο βαθμό ως διεπαφή μεταξύ της τεχνικής ομάδας και των εθελοντών διερμηνέων. Έχουν επίσης αναλάβει να αποστέλλουν τα πακέτα εργασίας σε συναδέλφους, να απαντούν στις ερωτήσεις τους και να τους βοηθούν σε οποιοδήποτε ζήτημα που ενδέχεται να αντιμετωπίσουν. Μετά την επικύρωση της μεταγραφής που έγινε από τη «μηχανή», οι συνάδελφοι επιστρέφουν στους συντονιστές τις παρατηρήσεις τους σχετικά με τις διορθώσεις που έκαναν, οι δε συντονιστές υποβάλλουν στη συνέχεια σχετική έκθεση στην τεχνική ομάδα.

Μία από τις πιο συναρπαστικές ανακαλύψεις για την ομάδα ήταν να δει πώς συμπεριφέρεται το σύστημα και πώς μπορεί να εξελιχθεί· οι διερμηνείς το έχουν περιγράψει σαν να διδάσκουν ένα πολύγλωσσο παιδί βασικά πράγματα, όπως να μην αναμειγνύει γλώσσες, αλλά και να αφήσουν αυτό το ρομποτικό παιδί ελεύθερο να εξελιχθεί μόνο του. Η μηχανή μαθαίνει να αντιμετωπίζει τα δύσκολα σημεία, να αυτο-διορθώνεται, να βελτιώνει συνεχώς την τεχνική της και να μην επαναλαμβάνει τα ίδια λάθη.

Πρόκειται για ένα μελλοντοστραφές, επαναστατικό έργο όσον αφορά τις προοπτικές που προσφέρει, ιδίως για τα άτομα με προβλήματα ακοής. Θα οδηγήσει σε ένα ευρύ φάσμα πολύ χρήσιμων και συγκεκριμένων εφαρμογών, όχι μόνο σε ολόκληρη την Ευρωπαϊκή Επιτροπή, για παράδειγμα, με τη μορφή αυτοματοποιημένων υποτίτλων σε συνεντεύξεις Τύπου, αλλά και, μακροπρόθεσμα, μέσω της παροχής εξατομικευμένων λύσεων στους Ευρωπαίους πολίτες. Η διάθεση υλικού σε άτομα με αναπηρία αποτελεί μία από τις κύριες κινητήριες δυνάμεις του έργου.