Catégories
Citoyenne éclairée Digital Humanities

Google est-il sexiste ?

Just go and google it! Rien de plus naturel dans notre quotidien à tous… Les chiffres le prouvent puisqu’avec ses 92,5 milliards de visites mensuelles, le moteur de recherche est, de loin, le site le plus visité au monde. Sa mission ? « Organiser les informations à l’échelle mondiale pour les rendre accessibles et utiles à tous »[1]. Mais selon quelles logiques ? L’algorithme de Google est-il infaillible ? Et si les « réponses » de Google à nos requêtes comportaient un biais sexiste ? C’est en tout cas l’hypothèse que nous allons tester dans ce papier.

©Unsplash Reza Rostampisheh

Le point de départ de cette réflexion est constitué par une interrogation très concrète : ayant lancé en janvier dernier un site intitulé « Citoyenne éclairée » (citoyenne-eclairee.com) dont le référencement naturel est plutôt bien travaillé, je me suis rapidement aperçue qu’alors que le site ressortait en première position sur Google en réponse à la requête citoyenne éclairée, il ressortait seulement en page 17 à la requête formulée au masculin, citoyen éclairé. Pourtant, en réponse à la requête formulée au féminin, des sites positionnés sur ces mots clés au masculin ressortaient, quant à eux, en première SERP. Une citoyenne éclairée ne ferait-elle pas partie selon Google des citoyens éclairés au même titre que n’importe quel autre citoyen éclairé ?

Sans rentrer dans le débat sur l’écriture inclusive, en français la règle grammaticale est que le masculin l’emporte lorsqu’il y a des hommes et des femmes dans un groupe. Cela veut dire donc que le masculin est inclusif, tandis que le féminin, lui, exclut le masculin.

Si on retranscrit cette règle grammaticale de manière bête et méchante dans notre usage des moteurs de recherche, on s’attendrait donc à ce qu’une recherche formulée au masculin comporte des résultats formulés à la fois au masculin et au féminin, et à ce qu’une recherche formulée au féminin comporte des résultats exclusivement au féminin. Est-ce bien ce qui se passe ? 

Reprenons notre exemple initial qui prenait comme référence la position du site citoyenne-eclairee.com sur Google. Voici ce que l’on observe en comparant les résultats de différents moteurs de recherche, selon la formulation de la requête au féminin ou au masculin :

 citoyenne éclairée
citoyen éclairé
GoogleSERP 1 (position 1) – environ 1 060 000 résultats
la SERP 1 affiche des résultats qui renvoient aux formulations « citoyen éclairé » et « citoyenneté éclairée »
SERP 17 – environ 5 860 000 résultats
renvoi vers une page du site qui affiche en gras le syntagme au pluriel masculin « citoyens éclairés »
Yahoo!SERP 1 (position 1)
la SERP 1 affiche des résultats qui renvoient à des formulations comme « citoyens éclairés » et « citoyen éclairé »
SERP 1 (position 8)
renvoi vers une page du site qui affiche en gras le syntagme féminin singulier « citoyenne éclairée »
BingSERP 1 (position 1)
231 000 résultats
la SERP 1 affiche des résultats qui renvoient à des formulations comme « citoyens éclairés » et « citoyen éclairé »
SERP 1 (position 8) – 279 000 résultats
renvoi vers une page du site qui affiche en gras le syntagme féminin singulier « citoyenne éclairée »
QwantSERP 1 (position 1)
la SERP 1 affiche des résultats qui renvoient à des formulations comme « citoyens éclairés » et « citoyen éclairé »
SERP 1 (position 2 et 7) – 278 000 résultats  
renvoi vers 2 pages du site qui affichent en surligné la formulation au féminin du syntagme
EcosiaSERP 1 (position 1)
233 000 résultats La SERP 1 n’affiche que des formulations au féminin singulier ou au pluriel : « citoyens éclairés »
SERP 1 (positions 2 et 6)
renvoi vers 2 pages du site qui affichent en surligné la formulation au féminin du syntagme
Position du site citoyenne-eclairee.com sur les moteurs de recherche et analyse des liens bleus proposés en SERP 1

A la lecture de ce tableau qui compare la position du site citoyenne-eclairee.com dans les SERPs des cinq moteurs de recherche les plus utilisés en France[1] on s’aperçoit que tandis que Yahoo!, Bing, Ecosia et Qwant affichent le site en première page de résultats indépendamment du genre choisi pour la requête, Google quant à lui, en réponse à la requête formulée au masculin réserve au site Citoyenne éclairée une place en 17ème page de son moteur de recherche. A prime abord, tout laisse penser que de manière contre-intuitive, chez Google le féminin serait inclusif et ferait afficher des résultats formulés au féminin et au masculin, tandis que le masculin serait exclusif et ne ferait afficher que des résultats formulés au masculin.

Est-ce suffisant pour affirmer que l’algorithme de Google comporte un sérieux biais sexiste ?

Notre première intuition a été de considérer cette différence de position du site pourrait se justifier essentiellement par le fait que Google indexe un plus gros volume de pages que ses concurrents, ainsi que par le fait que les producteurs de contenus écrivent plus souvent nos deux mots clés au masculin (environ 5 860 000 résultats pour la requête citoyen éclairé) qu’au féminin (environ 1 060 000 résultats pour la requête citoyenne éclairée). Par ailleurs, connaissant l’importance de son fameux PageRank[2] dans le fonctionnement de son algorithme, s’agissant d’un site relativement nouveau sans politique de netlinking fortement développée, on conçoit que Google ne puisse pas le faire apparaître en première SERP… Mais en 17ème ?! Autant dire, que l’internaute qui cherche une citoyenne éclairée en tapant sur Google citoyen éclairé, n’a strictement aucune chance de la trouver ! Une blague dans le domaine du SEO veut que pour cacher un cadavre, il suffise de le cacher en deuxième page des résultats Google.

Mais alors Google est-il sexiste, oui ou non ?

Impossible de tirer des conclusions à partir d’un seul et unique exemple ! Dès lors, nous avons constitué un mini corpus pour vérifier l’hypothèse initiale dans une optique moins nombriliste ! J Nous avons donc analysé les résultats affichés en SERP 1 de Google selon les formulations au masculin et au féminin de quelques autres requêtes : metteur en scène vs. metteuse en scène, consommateur responsable vs. consommatrice responsable, créateur meuble vs. créatrice meuble, électeur informé vs. électrice informée etc.

Pour plus de lisibilité, nous analyserons seulement 2 de ces exemples :

  • électeur informé vs. électrice informée
 électeur informéÉlectrice informée
Googlela SERP 1 de Google affiche des résultats qui renvoient à des pages de sites qui ont trait aux élections et à ceux qui expriment leur volonté politique aux urnes.Pour Google l’internaute qui tape électrice informée dans sa barre de recherche cherche, sans doute aucun, des informations au sujet de l’électricité ou des trottinettes électriques.
Yahoo!la SERP 1 de Yahoo ! affiche des résultats qui renvoient à des pages de sites qui ont trait aux élections et à ceux qui expriment leur volonté politique aux urnes.Pour Yahoo! il y a un doute. Si les liens bleus en SERP 1 renvoient vers des pages de sites qui ont trait aux questions électorales, les aperçus d’images en haut de la page proposent quant à eux des trottinettes électriques…
Bingla SERP 1 de Bing affiche des résultats qui renvoient à des pages de sites qui ont trait aux élections et à ceux qui expriment leur volonté politique aux urnes.Bing propose en premier résultat une page référencée sur le mot clé électricien, mais arrive, à la différence de Google, à isoler des pages ayant trait aux questions électorales et à celles qui expriment leur volonté politique aux urnes.
Qwantla SERP 1 de Qwant affiche des résultats qui renvoient à des pages de sites qui ont trait aux élections et à ceux qui expriment leur volonté politique aux urnes.la SERP 1 d’Ecosia affiche exclusivement de résultats qui renvoient à des pages de sites qui ont trait aux élections et surtout à celles qui expriment leur volonté politique aux urnes (la plupart des mots clés surlignés en gras sont formulés au féminin)
Ecosiala SERP 1 d’Ecosia affiche des résultats qui renvoient à des pages de sites qui ont trait aux élections et à ceux qui expriment leur volonté politique aux urnes.Si les liens bleus en SERP 1 ont exclusivement trait aux élections et à celles qui vont aux urnes pour exprimer leur volonté politique, la sélection d’image de Qwant renvoie aussi vers des photos de trottinettes électriques…

Pour résumer, sur les 5 moteurs de recherche en question, le seul et unique qui ne comprend pas la formulation au féminin du syntagme « électeur informé » – et donc est incapable de proposer des résultats pertinents pour la requête – est Google. Alors que Yahoo!, Bing et Qwant proposent des liens pertinents par rapport à la requête au féminin, leur fonctionnalité images confond les électrices informées et les trottinettes électriques. Ecosia nous apparaît comme le moteur de recherche le plus pertinent sur cette requête.

  • auteurs philosophie vs. autrices philosophie

Une fonctionnalité que le seul moteur de recherche Google propose pour améliorer l’expérience utilisateur a retenu toute notre attention. Il s’agit d’une liste de portraits de philosophes qui nous est proposée comme accueil de la SERP 1 pour les deux requêtes. Avec 51 entrées, la requête formulée au masculin recense 50 hommes et 1 seule et unique femme – Hannah Arendt, dont le portrait en question pourrait d’ailleurs porter à confusion. La liste affichée en réponse à la requête formulée au féminin est, quant à elle, un peu plus diversifiée ; cependant, ce sont toujours les illustres figures masculines qui l’emportent, tant quantitativement (sur les 51 entrées de cette nouvelle liste, seules 16 philosophes sont des femmes) que qualitativement (avec en tête de liste un homme : Jean-Paul Sartre). Là encore, à une exception près, il semble que, faisant fi de la règle grammaticale, l’algorithme de Google considère que le masculin est exclusif alors que le féminin, lui, accueille la gente masculine.

L’invisibilisation de la contribution et de la participation des femmes à toute œuvre collective et individuelle semble ainsi subir une double peine. Invisibilisées dans les textes en raison d’une langue intrinsèquement porteuse d’une réalité historique multiséculaire, sur le web, elles sont à nouveau invisibilisées par l’algorithme d’un moteur de recherche comme Google, alors même que nos requêtes cherchaient à les faire découvrir en priorité. Au regard de l’influence que ce moteur de recherche, plébiscité par la plupart, a dans la perpétuelle construction de nos représentations, il serait intéressant que cette problématique puisse être traitée de manière transparente par les ingénieurs et informaticiens de chez Google. A défaut de modifications structurelles, des explications !

La toile regorge d’autres exemples qui dénoncent le fonctionnement du moteur de recherche qui répliquerait dans son fonctionnement des biais sexistes ou racistes pré-existants :

Et vous ? Auriez-vous découvert d’autres exemples concrets qui contribueraient à dénoncer un éventuel biais sexiste de l’algorithme du moteur de recherche star ? Partagez-les en commentaire ou sur les réseaux sociaux en utilisant les hashtags #GoogleSexiste et #CitoyenneEclairée !


[1]D’après la page de présentation de la société sur : https://about.google/

[2] Les moteurs de recherche les plus populaires en France, Statistia.

[3] Le PageRank ou PR est l’algorithme d’analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google. Il mesure quantitativement la popularité d’une page web. Le PageRank n’est qu’un indicateur parmi d’autres dans l’algorithme qui permet de classer les pages du Web dans les résultats de recherche de Google. Ce système a été inventé par Larry Page, cofondateur de Google.