De simples données à la discrimination : quand les mots véhiculent des préjugés | Knowledge Centre on Translation and Interpretation

Par Meryem Murat, Ambre Desforges et Raphaëlle Duhamel, étudiantes en Master Langues étrangères appliquées à l'Université Grenoble Alpes

Drawn picture of a robot with the words 'Oops, 404 error' above it

Dans un monde où la communication internationale et l’accessibilité sont devenues essentielles, notamment pour des raisons économiques et sociales, la traduction automatique neuronale (TAN) est omniprésente. Son développement a un impact majeur sur la société et la culture : elle facilite les échanges, mais soulève aussi plusieurs problèmes.

En effet, la TAN s’appuie sur des modèles d’intelligence artificielle, en particulier des réseaux neuronaux profonds, pour analyser et générer des traductions de textes en tenant compte du contexte global. Des outils populaires, comme Google Traduction, DeepL, Bing Translate, Reverso, Gemini ou encore ChatGPT, utilisent ces technologies pour fournir des traductions rapides et accessibles.

Cependant, ces systèmes ne sont pas exempts de biais, car ils peuvent refléter des stéréotypes présents dans les données d’entraînement. Ces biais peuvent entraîner des injustices, de la marginalisation ou de l’exclusion dans des contextes professionnels ou culturels.

Origines et enjeux

On peut retrouver différents types de biais parmi les résultats générés par la TAN, notamment les biais liés au genre, à la culture ou au statut socio-économique. Ces modèles s’appuient sur des algorithmes et de grands corpus de données d’entraînement afin de fournir des traductions. Les biais observés peuvent donc venir de préjugés déjà présents dans ces données ou de disparités entre les langues dominantes (comme l’anglais ou les langues occidentales) et les langues moins représentées (comme le corse ou le gaélique).

Cependant, ces problèmes peuvent aussi résulter des limites des modèles eux-mêmes. En effet, les algorithmes sur lesquels reposent ces systèmes de TAN ont leurs propres limites. Par exemple, ils « devinent » souvent le genre ou le contexte à partir de probabilités calculées issues de leurs données, c’est-à-dire qu’ils peuvent mémoriser des associations spécifiques vues dans leurs données d’entrainement (par exemple, « infirmière » est souvent associée à un genre féminin), ou tenter de généraliser en adaptant les traductions à un contexte plus large.

Cependant, une mémorisation excessive peut entraîner des biais récurrents tandis qu’une généralisation excessive peut mener à des erreurs de traduction ou des phrases maladroites. Il est donc essentiel de rester vigilant.e lorsque l’on utilise ces systèmes, car ils peuvent influencer la traduction de textes sensibles (liés au genre, à la culture, à la religion, etc.), en reflétant ou renforçant les préjugés présents dans la société, ce qui peut parfois avoir de graves conséquences.

Regardons plus en détail les types de biais que ces systèmes peuvent produire.

Les limites de la neutralité : genre, culture et langues minoritaires

Bien que la TAN se soit prouvée être en moyenne plus performante que les anciennes technologies (Junczys-Dowmunt, Dwojak & Hoang, 2016), elle rencontre souvent des difficultés avec les langues peu genrées ou qui utilisent des formes neutres. Par conséquent, elle tend à associer un genre précis à certains métiers ou rôles sociaux selon des stéréotypes.

Par exemple, traduire à partir du turc comme langue source peut se révéler difficile, car le turc est une langue neutre du point de vue du genre.

La phrase « O bir doktor ve o bir hemşire » (Traduction littérale : « Il/elle est médecin, et il/elle est infirmier/infirmière ») est traduite par « He is a doctor, and she is a nurse », ce qui n’est pas vraiment correct. Cet exemple montre que l’outil (ici Google Traduction) fait des suppositions basées sur des stéréotypes. On peut donc en déduire que la TAN « favorise des associations stéréotypées qui renforcent les préjugés sexistes dans le texte traduit » (Wisniewski et al., s.d., p.38, notre traduction). Ce type de problème peut déformer la manière dont certains groupes (dans notre cas, les femmes) sont représentés (préjudice de représentation – appelé en anglais « representational harm »^[1]) ou entraîner des services de traduction de moindre qualité pour les femmes (préjudice d’attribution – appelé en anglais « allocational harm »^[2]) (Crawford, 2017 ; Blodgett et al, 2020).

De plus, certains systèmes de TAN traduisent de manière incorrecte les noms propres, les termes religieux ou culturels. Ils leur arrivent aussi d’ignorer les nuances culturelles. C’est le cas de Reverso pour la phrase japonaise « お花見に行きましょう.

Screenshot of the translation of a sentence from Japanese into English in Reverso

Traduire cette phrase par « Let’s go flower viewing » (Traduction littérale : « Allons voir les fleurs ») ne rend pas compte de la connotation culturelle associée au terme « Hanami » (tradition japonaise qui consiste à aller admirer les cerisiers en fleurs, appelés « Sakura » qui sont un symbole du Japon et de la période de plantation du riz). En retirant la référence au Sakura, on supprime toutes les connotations culturelles de la traduction. Une traduction plus adaptée serait « Let’s go and see the cherry blossoms » (Traduction littérale : « Allons voir les cerisiers en fleurs »).

La précision des traductions automatiques (TA) varie considérablement selon les paires de langues impliquées. Par exemple, Google Traduction atteint une précision de 94 % pour les traductions de l’anglais vers l’espagnol, deux langues largement parlées. En revanche, pour des paires de langues moins courantes, comme l’anglais vers l’arménien, cette précision chute à 55 % (Sonix, 2024). Par conséquent, la précision des outils de TA est souvent plus basse pour les langues régionales ou minoritaires, ce qui reflète des inégalités linguistiques. En effet, pour ces langues, les corpus de textes bilingues sont souvent limités ou non-existants, ce qui rend difficile le développement de systèmes de TA efficaces.

Ces systèmes peuvent aussi effacer certains aspects importants de l’identité des minorités selon les langues à traduire.

Screenshot of the translation of a sentence from French into Russian in DeepL

Par exemple, ici, DeepL ne traduit pas correctement une expression liée à l’identité LGBTQIA+. Le mot « partenaire » est souvent utilisé en anglais ou en français dans les couples LGBTQIA+ pour sa neutralité. Dans la phrase française « Ma partenaire est compréhensive », le mot « partenaire » est neutre, mais « ma » (forme féminine) indique qu’il s’agit d’une femme. Le mot « partenaire » peut ne pas avoir les mêmes connotations non genrées dans toutes les langues, ce qui pourrait affecter la perception ou la compréhension. Ici, en russe, « ma partenaire » est automatiquement traduite au masculin (« мой партнер »), ce qui modifie le sens. On perd ainsi la nuance de genre de la phrase originale, ce qui peut prêter à confusion dans un contexte où le genre ou l’orientation sexuelle de l’orateur ou du partenaire est important pour le message. En outre, le mot « partenaire » en français permet d’éviter de préciser un statut légal (marié ou non), ce qui est important dans les contextes LGBTQIA+. La forme masculine automatique en russe supprime cette neutralité et introduit potentiellement des présomptions involontaires.

Comme les systèmes de traduction automatique sont formés à partir de corpus existants, ils contiennent souvent des préjugés humains qui peuvent conduire à des traductions inexactes. L’amplification des stéréotypes ou des erreurs liées à des données de formation biaisées peut donc également se retrouver dans les textes traduits par la TAN.

Conséquences pour les individus et les relations internationales

Les biais dans la traduction automatique ont de nombreuses conséquences sociales, individuelles et politiques. Sur le plan social, ils reproduisent et renforcent les stéréotypes de genre (par exemple, médecin = homme, infirmière = femme) et marginalisent les langues et cultures minoritaires, ce qui renforce les inégalités linguistiques et culturelles.

Dans les situations concrètes, des traductions incorrectes ou offensantes peuvent poser problème, surtout pour des documents officiels, comme des contrats ou des textes juridiques. Les personnes non binaires ou parlant une langue rare peuvent se heurter à des traductions peu inclusives ou erronées.

Sur le plan politique, ces biais favorisent l’uniformisation culturelle en effaçant des subtilités linguistiques ou culturelles. Une mauvaise traduction peut entraîner des malentendus diplomatiques. Par exemple, pendant la Seconde Guerre mondiale, le mot japonais « mokusatsu » a été mal interprété comme « sans intérêt » au lieu de « pas de commentaire », ce qui aurait influencé la décision des États-Unis de bombarder Hiroshima (H. Nussbaum, s. d.).

Enfin, ces biais nuisent à la confiance dans les outils de traduction. Si les utilisateurs perçoivent les traductions comme fausses ou biaisées, ils risquent de s’en détourner. Il devient donc urgent de créer des systèmes plus justes et inclusifs.

Vers des traductions plus justes : quelles solutions pour éviter les biais ?

Plusieurs pistes sont possibles pour améliorer la TAN. Une première est de diversifier les données d’entraînement, en intégrant plus de textes issus de langues et de cultures minoritaires. Il faut aussi privilégier la qualité des données, pas seulement leur quantité.

Une autre solution est l’apprentissage supervisé, où des linguistes experts corrigent et encadrent les traductions. Certains outils, comme DeepL ou Gemini, proposent déjà des traductions alternatives avec différents genres. Cette pratique permet aux utilisateurs de choisir la version qui correspond le mieux au contexte.

Enfin, au-delà des aspects techniques, il est important d’informer le public sur les limites de ces outils. Les utilisateurs doivent être conscients des biais possibles pour utiliser ces technologies de manière critique.

La TAN peut-elle vraiment être neutre ?

La TAN est aujourd’hui très répandue, mais ses biais posent encore de nombreux problèmes. Ces biais, dus aux données et aux limites des algorithmes, peuvent renforcer les stéréotypes et marginaliser certaines langues ou identités. Pour y remédier, il faut diversifier les sources, impliquer des humains dans la supervision, et sensibiliser les utilisateurs.

Les développeurs et entreprises ont un rôle crucial à jouer en rendant leurs systèmes plus transparents, plus équitables et plus représentatifs. Les utilisateurs, eux aussi, peuvent signaler les biais observés pour aider à améliorer ces outils.

Cependant, une question reste ouverte : une machine pourra-t-elle un jour vraiment être neutre ? Certains outils, comme ChatGPT ou Gemini, progressent et commencent à éviter certaines erreurs, mais il reste à voir s’ils pourront un jour refléter toute la richesse et la complexité des langues et des cultures sans biais.

^[1] Selon Katzman et ses collègues (2023, p.1, our translation), le préjudice de représentation est « [d]es apports qui peuvent affecter la compréhension, les croyances et les attitudes que les gens ont à l'égard de groupes sociaux particuliers, et donc la position de ces groupes au sein de la société ».

^[2] Selon Katzman et ses collègues (op. cit.), le préjudice d’attribution décrit « les personnes appartenant à des groupes sociaux particuliers sont injustement privées de l'accès à des opportunités ou à des ressources importantes ».

Références

Blodgett, S. L.; Barocas, S., Daumé, H. III, & Wallach, H. (2020). Language (technology) is power: A critical survey of “bias” in NLP. Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics (ACL), 5454–5476.

Crawford, K. (2017). The trouble with bias. Conference on Neural Information Processing Systems, Keynote.

Ehrensberger-Dow, M., & O᾽Brien, S. G. A. (2015). Interdisciplinarity in translation and interpreting Process Research. Amsterdam: Johns Benjamins Publishing Company.

Hong, W., & Rossi, C. (2021). The cognitive turn in metaphor translation studies: A critical overview. Journal of Translation Studies, 2, 83–115.

IA et traduction : Ce qu’il faut savoir. (n.d.). Ottiaq.org, from https://ottiaq.org/app/uploads/2024/01/page-web-sur-ia-pour-site-ottiaq…

Isabelle, P., Cherry, C., & Foster, G. (2017). A challenge set approach to evaluating machine translation. In M. Palmer, R. Hwa, & S. Riedel (Eds.), Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing (pp. 2486–2496). Association for Computational Linguistics.

Junczys-Dowmunt, M., Dwojak, T., & Hoang, H. (2016). Is neural machine translation ready for deployment? A case study on 30 translation directions. arXiv [cs.CL]. http://arxiv.org/abs/1610.01108

Nussbaum, H. (n.d.). Mokusatsu: One Word, Two Lessons.

Reid, N., J., & Katz, A. N. (2018). Vector space applications in metaphor comprehension. Metaphor and Symbol, 33(4), 280–294. https://doi.org/10.1080/10926488.2018.1549840

Précision de la traduction automatique : Évaluation globale. (2024). Sonix; Sonix.ai.https://sonix.ai/resources/fr/la-precision-de-la-traduction-automatique/

Katzman, J. et al. (2023). Taxonomizing and measuring representational harms: A look at image tagging. arXiv:2305.01776.

Tudor, M.-D. (2022). La traduction des expressions idiomatiques à l’aide de moteurs de traduction automatique. Analele Universității Bucuresti. Limbi si Literaturi Străine, 2, 109-128.

Vaguer, C. (2011). Expressions figées et traduction : langue, culture, traduction automatique, apprentissage, lexique. In J.-C. Anscombre & S. Mejri, Le figement linguistique : la parole entravée, Honoré Champion, pp. 391–411.

Wisniewski, G., Zhu, L., Ballier, N., & Yvon, F. (2022). Biais de genre dans un système de traduction automatique neuronale : une étude des mécanismes de transfert cross-langue. Traitement automatique des langues, 63(1), 37–61.

Détails

Date de publication : 26 mai 2025
Langues: anglais, français, italien, néérlandais
Catégorie EMT : Technologies de la traduction