Est-ce qu'un ordinateur peut nous faire pleurer? Question revisitée avec l'uncanny valley

Les jeux vidéo sont plus populaires et son industrie est plus rentable que jamais auparavant. Ce mode de divertissement a beaucoup changé depuis l’époque des arcades marquées par des jeux tels que Pong et Pac-Man. Les jeux vidéo modernes comportent souvent des graphiques en 3D photoréalistiques renversant en plus de présenter des scénarios complexes et engageants qui ont aidé ce divertissement à dépasser l’industrie du cinéma en termes de profits et de parts du marché. Les joueurs de jeux vidéo deviennent eux-même une partie du narratif en incarnant virtuellement des personnages à travers des jeux ayant des durée de vie dépassant fréquemment les 20 heures de jeu. C’est une expérience fort différente qu’observer une histoire de l’extérieur lors de la projection d’un film de 1 à 2 heures. Cela implique que les jeux vidéo peuvent parfois provoquer des réponses émotionnelles bien plus fortes que les films, ce qui permet à certains jeux de devenir de véritables cultes avec des amateurs dévoués attendant avec impatience la sortie du prochain jeu d’envergure.

La prémisse générale proposée autant par les producteurs de jeux et par les fabricants de composantes matérielles en informatique est que des graphiques plus raffinés vont provoquer un engagement plus important envers le jeu. Cela semble avéré pour les paysages, les objets et même les les costumes et les coupes de cheveux des personnages présentés. Par contre, il pourrait y avoir une exception intéressante à cette règle pour les expressions faciales. Je suis moi-même un fervent gamer mais quand les personnages présentés vivent des émotions telles que la colère ou la tristesse, je me sens rarement réellement empathique envers eux. Pourtant, je suis le premier à verser toutes les larmes de mon corps lorsque quelque chose de dramatique se produit dans un film d’animation avec des personnages modelés de manière moins réaliste. Cela m’a intrigué, et j’ai alors décidé de me renseigner sur pourquoi cela se produisait. J’étais aussi curieux de savoir si j’étais vraiment le seul à avoir de la difficulté à m’émouvoir en voyant uniquement un personnage de jeu vidéo vivre des émotions désagréables. Est-ce que je suis le seul à ressentir un espèce de malaise quand je vois un visage photoréaliste animé exprimant une émotion sur un écran ? Est-ce qu’il y aurait une explication scientifique qui me permettrait de comprendre pourquoi je m'émeus devant des vrais être humains ou encore des personnages avec des traits plus caricaturés mais pas devant des visages informatisés ayant une ressemblance incontestable à des vrais visages ?      

Voilà qu’entre en jeu l’uncanny valley. Ce phénomène a été initialement introduit dans le cadre de discussions sur les robots humanoïdes. Par contre, il s’agit d’une notion qui s’applique très bien pour les visages générés par ordinateur, comme ceux qu’on retrouve dans les jeux vidéo.     

Comme vous pouvez le voir sur le graphique ci-dessous, l’affinité qu’on ressent envers des personnages artificiels (des robots ou générés par ordinateur) augmente graduellement au fur et à mesure que la ressemblance avec des vrais être humains s’accentue. Par contre, et c’est là que ça devient intéressant, quand la ressemblance atteint un pourcentage élevé, il y a une chute dramatique dans l’affinité. Cette chute est ce qu’on appelle l’uncanny valley. Les humanoïdes très réalistes ainsi que les visages animés photoréalistes sont concernés par ce phénomène et sont souvent décrits comme malaisant, louche, voire perturbant.       

Images de Schindler et al. (2017) présentant un visage avec des traits de dessin animé (gauche) comparé à un visage photoréaliste (droite).

C’est très chouette tout ça, mais il ne s’agit que d’une expérience de pensée et cela ne décrit que le sentiment subjectif d’affinité. Par contre, soyez sans crainte, des travaux fascinants ont été effectués à ce sujet en examinant comment le cerveau répondait à des visages générés par ordinateur relativement à des photos de visages de vrais êtres humains. 

Une équipe de recherche a décidé d’utiliser l’imagerie à résonance magnétique (l'IRM) afin d’examiner si des expressions animées de visages générés par ordinateur pouvait augmenter l’activité cérébrale associée au traitement émotionnel de la même manière que des mouvements expressifs de vrais visages. Les chercheurs ont trouvé que les deux formes de visages génèrent une activité similaire de l’amygdale. Il s’agit d’une région qui répond surtout à des stimuli émotionnels. C’est une région qui est par contre très sensible, qui agit un petit peu comme un système d’alarme qui nous aide à détecter les menaces et choses excitantes autour de nous. Cela expliquerait pourquoi des visages très photoréalistes pourraient activer l’amygdale et pourquoi, du fait même, le profil d’activation de cette région ne peut pas nous aider à comprendre l’uncanny valley. Ceci dit, les chercheurs ont aussi demandé aux participants de coter l’intensité émotionnelle des visages présentés. Il semblerait que les visages provenant de vraies personnes provoqueraient des cotations plus intenses que ceux provenant de visages modelés par ordinateurs. Pourtant, ces différences n’ont pas été observées dans les profils d’activation. En fait, le sentiment subjectif d’intensité émotionnelle est quelque chose de bien plus complexe qu’une détection de menace instinctive telle que le permettrait l’amygdale. La perception de l’intensité émotionnelle repose sur plusieurs circuits et régions que cette étude n’a pas examinée. 

Une autre avenue des plus riches pour comprendre le traitement émotionnel dans le cerveau est l’usage de l'électroencéphalogramme ou EEG. L’EEG est un petit peu comme une caméra vidéo flouée: Cela permet de voir en temps réel l’activité électrique se déroulant dans le cerveau, sans nécessairement savoir d’où cette activité provient. Cela peut être très utile dans la mesure qu’on peut documenter sur la chronologie associée à différentes activités cognitives qui ne peuvent pas être mesurées autrement. En ce qui a trait à l'activité générée par des expressions faciales émotionnelles, les résultats sont très intéressants. Il semblerait que des visages ayant un style de dessin animé peuvent provoquer des émotions, mais que cela est surtout vrai au premier regard. Après un certain temps, la réponse émotionnelle était plus élevée pour les visages photoréalistes et les vrais visages que pour des visages avec des traits davantage inspirés des dessins animés. Une explication possible à cela est que des visages plus détaillés requièrent plus de temps à être perçus complètement, ce qui peut amener un traitement émotionnel plus détaillé. De plus, les visages ayant des traits de dessin animés et les vrais visages semblent créer la même activité sur le plan de l’analyse du traitement de visages. Les visages photoréalistes ne semblent pas, alors, traités de la même façon que les vrais visages ou ceux ayant des traits ressemblant à ce qu’on voit dans des dessins animés. Les deux peuvent provoquer des émotions, mais pas nécessairement pour les mêmes raisons. 

Donc, comment peut-on expliquer l’uncanny valley? Comme j’ai essayé de l’illustrer, il y a plusieurs façons de répondre à cette question. Il y a des similarités et des différences dans nos réactions à des vrais visages et des visages modelés par ordinateurs. Si nous parlons de réactions instinctives surtout, l’uncanny valley n’a pas d’importance. Par contre, si nous considérons des réactions émotionnelles plus complexes, ce phénomène peut trouver sa pertinence. Nos cerveaux sont excellents pour détecter qu’un visage donné n’en n’est pas un “vrai”, ce qui peut émousser l’engagement émotionnel envers des personnages modelés par ordinateur. Par contre, cela ne veut pas dire qu’un ordinateur ne peut pas nous émouvoir. Il y a bien plus de facteurs qui peuvent provoquer des émotions dans un film d’animation ou encore un jeu vidéo que juste un visage. Plusieurs autres facteurs peuvent compenser pour l’uncanny valley. Parfois, un bon acteur vocal peut provoquer des émotions importantes et, dans d’autres occasions, un scénario engageant peut provoquer un engagement émotionnel. L’uncanny valley peut certes affecter notre engagement émotionnel, mais il ne faut surtout pas oublier que le divertissement est complexe et que les médiums concernés reposent sur plusieurs dimensions. Donc, on peut revisiter la fameuse question qu’EA Games a posé dans les années 80: Est-ce qu’un ordinateur peut nous faire pleurer? Probablement, du moins s’il nous présente plus qu’un visage particulièrement louche.

Je suis étudiant au doctorat en neuropsychologie (profil recherche/intervention) à l’Université du Québec à Troisi-Rivières sous la direction du Professeur Simon Rigoulot et de la Professeure Isabelle Blanchette. Mes intérêts de recherche portent sur les neurosciences affectives. Plus précisément, j’utilise l’EEG pour élucider les processus cognitifs impliqués dans le traitement d’informations émotionnelles

Laisser un commentaire

Votre adresse courriel ne sera pas publiée.

FR
Scroll to Top