Frapper les livres: le parti pris derrière l’incapacité des assistants d’IA à comprendre les accents


L’ère de pouvoir parler à nos ordinateurs comme nous le faisons avec d’autres humains est enfin arrivée, mais les assistants à commande vocale comme Siri, Alexa et Google Home ne se sont pas avérés aussi révolutionnaires – ou inclusifs – que nous l’espérions. ils le seraient. Bien que ces systèmes fassent un effort louable pour interpréter avec précision les commandes, que vous ayez choisi votre accent à Houston ou à Hambourg, pour les utilisateurs avec des accents plus lourds ou moins courants tels que Caribbean ou Cockney, les demandes adressées à leurs assistants numériques sont carrément ignorées. Dans son essai “Siri Disciplines” pour Votre ordinateur est en feu du MIT Press, professeur à l’Université de Towson Dr Halcyon M. Lawrence, examine certaines des lacunes les plus flagrantes de cette technologie naissante, comment ces échecs évitables ont effectivement exclu un nombre important d’utilisateurs potentiels et les préjugés occidentaux qui sous-tendent le problème.

Presse MIT

Extrait de “Votre ordinateur est en feu”Copyright © 2021 Edité par Thomas S. Mullaney, Benjamin Peters, Mar Hicks et Kavita Philip. Utilisé avec l’autorisation de l’éditeur, MIT Press.


Les technologies vocales sont régulièrement décrites comme révolutionnaires. Outre la capacité de la technologie à reconnaître et à reproduire la parole humaine et à fournir un environnement mains libres aux utilisateurs, ces affirmations révolutionnaires, des rédacteurs technologiques en particulier, émergent d’un certain nombre de tendances: le nombre croissant de personnes qui utilisent ces technologies, le le volume des ventes d’assistants personnels comme Alexa d’Amazon ou Google Home, et le nombre croissant d’applications nationales utilisant la voix. Si vous êtes un utilisateur régulier (ou concepteur) de la technologie vocale, alors l’affirmation susmentionnée peut résonner avec vous, car il est fort possible que votre vie en ait été facilitée. Cependant, pour les orateurs avec un accent non standard (par exemple, la langue vernaculaire afro-américaine ou Cockney), les assistants virtuels comme Siri et Alexa ne répondent pas et sont frustrants – il existe de nombreuses vidéos YouTube qui démontrent et même parodient ces cas. Pour moi, qui parle l’anglais des Caraïbes, il y a «silence» lorsque je parle à Siri; cela signifie qu’il existe de nombreux services, produits et même des informations auxquels je ne peux pas accéder à l’aide de commandes vocales. Et si j’ai d’autres moyens d’accéder à ces services, produits et informations, quelle est l’expérience des locuteurs accentués pour qui la parole est le mode de communication principal ou singulier? Cette soi-disant «révolution» les a laissés pour compte. En fait, Mar Hicks nous pousse à considérer que toute technologie qui renforce ou réinscrit les préjugés n’est pas, en fait, révolutionnaire mais oppressante. Le fait que les technologies vocales ne font rien pour changer les «préjugés sociaux et hiérarchies» existants, mais au contraire les renforcent, signifie que ces technologies, bien qu’utiles pour certains, ne sont en aucun cas révolutionnaires.

On pourrait soutenir que ces technologies sont naissantes et que davantage d’accents seront pris en charge au fil du temps. Bien que cela puisse être vrai, les tendances actuelles ne sont pas convaincantes. Voici quelques questions à considérer: premièrement, pourquoi les accents ont-ils été principalement développés pour l’anglais standard dans les cultures occidentales (comme l’anglais américain, canadien et britannique)? Deuxièmement, pour les cultures non occidentales pour lesquelles un support d’accent non standard a été développé (comme Singapour et Hinglish), qu’est-ce qui motive ces initiatives? Troisièmement, pourquoi n’y a-t-il pas eu de soutien d’accent non standard pour les locuteurs minoritaires d’anglais? Enfin, quels ajustements – et à quel coût – les anglophones standards et à accent étranger doivent-ils faire pour s’engager avec les technologies vocales existantes?

Dans sa biographie d’esclave, Olaudah Equiano a dit: «J’ai souvent pris un livre, j’en ai parlé, puis j’y ai mis les oreilles, quand j’étais seul, dans l’espoir qu’il me répondrait; et j’ai été très inquiet quand j’ai trouvé qu’il restait silencieux. L’expérience d’Equiano avec l’interface traditionnelle d’un livre reflète le silence que les anglophones non standard et étrangers rencontrent souvent lorsqu’ils essaient d’interagir avec des technologies vocales comme Siri d’Apple, Alexa d’Amazon ou Google Home. Fondées sur la promesse d’une utilisation du langage naturel pour les locuteurs, ces technologies encouragent leurs utilisateurs à ne modifier en aucune façon leurs modèles de langage pour des interactions réussies. Si vous possédez un accent étranger ou parlez dans un dialecte, les technologies de la parole pratiquent une forme d ‘«altérité» biaisée et disciplinaire, exigeant une forme d’assimilation postcoloniale aux accents standards qui «fait taire» la réalité socio-historique du locuteur.

Parce que ces technologies n’ont pas été fondamentalement conçues pour traiter la parole non standard et aux accents étrangers, les locuteurs doivent souvent ajuster leur discours – c’est-à-dire changer leurs accents – pour réduire les erreurs de reconnaissance. Le résultat est la marginalisation et la délégitimation soutenues des locuteurs non standard et à accent étranger de la langue anglaise. Cette assimilation forcée est particulièrement flagrante étant donné que le nombre de locuteurs de langue seconde de l’anglais a déjà dépassé le nombre de locuteurs de langue maternelle anglaise dans le monde. Le nombre de locuteurs d’anglais langue seconde (ESL) continuera d’augmenter car l’anglais est utilisé dans le monde comme lingua franca pour faciliter les activités commerciales, académiques, récréatives et technologiques. Une implication de cette tendance est qu’au fil du temps, les anglophones peuvent exercer moins d’influence sur les structures lexicales, syntaxiques et sémantiques qui régissent la langue anglaise. Nous commençons à assister à l’émergence de langues hybrides comme le spanglish, le konglish et le hinglish, pour n’en nommer que quelques-unes. Pourtant, malgré cette tendance et les implications évidentes, la parole à accent étranger et non standard est marginalement reconnue par les dispositifs à médiation vocale.

Gluszek et Dovidio définissent un accent comme une «manière de prononciation avec d’autres niveaux linguistiques d’analyse (grammaticale, syntaxique, morphologique et lexicale), plus ou moins comparable à la langue standard». Les accents sont particuliers à un individu, un lieu ou une nation, identifiant où nous vivons (par des accents géographiques ou régionaux, comme l’Amérique du Sud, l’Amérique noire ou le Cockney britannique, par exemple), notre statut socio-économique, notre appartenance ethnique, notre distribution, notre société classe, ou notre première langue. La préférence pour son accent est bien documentée. Les individus perçoivent les personnes ayant des accents similaires aux leurs plus favorablement que les personnes ayant des accents différents des leurs. La recherche a démontré que même les bébés et les enfants montrent une préférence pour leur accent natif. Cela est cohérent avec la théorie selon laquelle la similitude des attitudes et des caractéristiques affecte à la fois les processus de communication et les perceptions que les gens se font les uns des autres.

Cependant, avec les accents, l’attraction de similitude n’est pas toujours le cas. Les chercheurs ont contesté le principe d’attraction de similitude, suggérant qu’il est plutôt spécifique au contexte et que les préjugés culturels et psychologiques peuvent souvent conduire à des perceptions positives d’accents non similaires. Des accents différents portent parfois des stéréotypes positifs qui conduisent à des perceptions positives du discours ou du locuteur. Des études montrent également que même si les auditeurs sont exposés à des accents différents, ils montrent une préférence pour les accents standard, comme l’anglais britannique standard, par opposition aux variétés non standard comme les accents Cockney ou écossais.

D’un autre côté, les accents non similaires ne sont pas toujours perçus positivement et les locuteurs à l’accent étranger font face à de nombreux défis. Par exemple, Flege note que parler avec un accent étranger entraîne une variété de conséquences possibles pour les apprenants de langue seconde (L2), y compris la détection de l’accent, une acceptabilité diminuée, une intelligibilité diminuée et une évaluation négative. Peut-être l’une des plus grandes conséquences d’avoir un accent étranger est que les utilisateurs de L2 ont souvent du mal à se faire comprendre à cause d’erreurs de prononciation. Même les locuteurs natifs accentués (les locuteurs de variantes de l’anglais britannique, comme moi, par exemple) éprouvent des difficultés similaires en raison des différences de prononciation.

Lambert et coll. a produit l’une des premières études sur les attitudes linguistiques démontrant un biais linguistique. Depuis lors, la recherche a constamment démontré des perceptions négatives sur la parole produite par des locuteurs non natifs. Au fur et à mesure que la parole se rapproche du non accentué, les perceptions de l’auditeur deviennent plus favorables, et à mesure que la parole devient moins similaire, les perceptions de l’auditeur deviennent moins favorables; dit d’une autre manière, plus l’accent étranger est fort, moins le discours est favorable.

Le discours non natif évoque des stéréotypes négatifs tels que les locuteurs sont perçus comme des locuteurs moins intelligents, moins loyaux, moins compétents, pauvres de la langue et comme ayant une faible compétence politique. Mais le biais ne s’arrête pas à la perception, car des pratiques discriminatoires associées aux accents ont été documentées dans le logement, l’emploi, les décisions de justice, les emplois de statut inférieur et, pour les étudiants, le déni de l’égalité des chances dans l’éducation.

Malgré les façons documentées dont les personnes qui parlent avec un accent subissent régulièrement un traitement discriminatoire, il y a encore très peu de discussions dominantes sur le biais d’accent et la discrimination. À l’automne 2017, j’ai reçu l’évaluation d’étudiant suivante d’un de mes étudiants, qui était un anglophone non natif et un futur programmeur informatique:

Je vais être très dur ici mais s’il vous plaît ne soyez pas offensé – votre accent est horrible. En tant que locuteur non natif de l’anglais, j’ai eu beaucoup de mal à comprendre ce que vous dites. Un exemple qui colle le plus est que vous dites objectif mais j’entends goule. Alors que c’était drôle au début, cela est devenu ennuyeux au fur et à mesure que le semestre avançait. J’ai eu l’impression que vous êtes très fier de votre accent, mais je pense que tout comme le film commence [sic] jouer dans des films et changer d’accent, lorsque vous déclarez que vous devriez essayer de parler clairement avec l’accent américain afin que les étudiants non autochtones puissent mieux vous comprendre.

Même si j’étais décontenancé, je n’aurais pas dû l’être. David Crystal, un linguiste britannique respecté et renommé qui est un invité régulier d’une émission de radio britannique, a déclaré que les gens écrivaient à l’émission pour se plaindre des prononciations qu’ils n’aimaient pas. Il déclare: «C’est la nature extrême de la langue qui m’a toujours frappé. Les auditeurs n’ont pas simplement dit qu’ils «n’aimaient pas» quelque chose. Ils ont utilisé les mots les plus émotifs auxquels ils pouvaient penser. Ils ont été «horrifiés», «consternés», «abasourdis», «consternés», «indignés» quand ils ont entendu quelque chose qu’ils n’aimaient pas. » Crystal continue en suggérant que les réactions sont si fortes parce que la prononciation (ou l’accent) est fondamentalement une question d’identité. C’est une question de race. C’est une question de classe. Il s’agit de l’appartenance ethnique, de l’éducation et de la profession. Lorsqu’un auditeur s’occupe de la prononciation d’un autre, il s’occupe finalement de l’identité de l’orateur.

En réfléchissant à l ‘«évaluation» de mon accent par mon élève, j’ai été frappé par le fait que ce commentaire aurait provoqué l’indignation s’il avait été fait au sujet des caractéristiques immuables de la race, de l’ethnie ou du sexe; Pourtant, en ce qui concerne les accents, il y a une acceptabilité à propos de la pratique du biais d’accent, en partie parce que les accents sont considérés comme une caractéristique mutable d’un locuteur, variable à volonté. Comme mon élève l’a fait remarquer, après tout, les stars de cinéma à Hollywood le font tout le temps, alors pourquoi pas moi? Bien que les individus aient démontré la capacité d’adopter et de basculer entre les accents (appelé changement de code), cela devrait être une question de choix personnel, car l’accent est indissociable de son identité. Mettre sur un autre une attente de changement d’accent est oppressant; créer des conditions où le choix de l’accent n’est pas négociable par le locuteur est hostile; imposer un accent à un autre est violent.

Un domaine dans lequel le biais d’accent est répandu est celui des dispositifs apparemment bénins tels que les systèmes de sonorisation et les systèmes de menus des banques et des compagnies aériennes, pour n’en nommer que quelques-uns; mais le manque de diversité des accents est particulièrement frappant dans les assistants personnels tels que Siri d’Apple, Alexa d’Amazon et Google Home. Par exemple, alors que les appareils tels que les systèmes de sonorisation ne nécessitent que les auditeurs pour comprendre les accents standard, les assistants personnels, en revanche, nécessitent non seulement la compréhension, mais la performance des accents standard par les utilisateurs. Par conséquent, ces appareils exigent que l’utilisateur s’assimile à l’anglais standard – une pratique qui, à son tour, aliène les anglophones non natifs et non standard.



Source link

Leave a Reply

Your email address will not be published. Required fields are marked *