La face cachée de l'innovation : un autre regard sur le phénomène technologique du moment, ChatGPT

ChatGPT : le mot est sur toutes les lèvres des techno-enthousiastes. Capable d’écrire un livre à partir de quelques indications, il est indéniable que ce nouvel outil met des étoiles dans les yeux des amoureux de la technologie dès ses premières utilisations. Mais au-delà de cette prouesse technologique bien visible, que se cache-t-il derrière le phénomène du moment porté par l’intelligence artificielle générative ? Quels impacts environnementaux, sociaux et sociétaux induit-il ?

Image générée par le logiciel DALL-E d'OpenAI en quelques itérations sur la base de la demande suivante (traduite de l'anglais) : personnes marchant dans les rues de Paris avec des smartphones, drapeau américain en arrière plan

Image générée par le logiciel DALL-E d'OpenAI en quelques itérations sur la base de la demande suivante (traduite de l'anglais) : personnes marchant dans les rues de Paris avec des smartphones, drapeau américain en arrière plan

 

Il n’en finit plus de faire parler de lui. ChatGPT est le phénomène Tech du moment. Outil conversationnel dopé à l’intelligence artificielle (IA) développée par l’entreprise OpenAI, les cas d’usages de ce chat bot ont déjà explosé au gré de l’imagination de ses utilisateurs, et les marques ont vite saisi l’intérêt d’un tel outil pour maximiser l’efficacité de leurs campagnes publicitaires, en créant facilement du contenu personnalisé, ciblé et illustré (en combinaison avec d’autres outils permettant de créer des images, comme Dall-E ou Midjourney), à l’instar de Microsoft ou Coca-Cola. Et ce n’est qu’un début, OpenAI venant tout juste de présenter la nouvelle version du logiciel, GPT4.

Mais que se cache-t-il réellement derrière cette intelligence artificielle ? Quels sont les moyens déployés pour arriver à de tels résultats ?

Regardons de plus près les impacts environnementaux, sociaux et sociétaux de cette technologie.

1. Il est difficile d’avoir une idée précise du coût énergétique et environnemental de cette technologie. Les e-novateurs ont fait le point sur les données disponibles. On distingue deux phases : la phase d'entraînement de l’intelligence artificielle où une énorme quantité de données sera fournie à la machine pour son apprentissage et la phase de fonctionnement où l’outil répond aux requêtes des utilisateurs. Il y a peu d’informations disponibles sur le coût énergétique de la phase de fonctionnement, en revanche, l’impact de la phase d'entraînement est estimé à 552 tonnes d’équivalent CO2, soit plus de 2,5 millions de km parcourus en voiture.

2. D’autres sujets sont encore plus invisibles que les impacts environnementaux et ternissent pourtant fortement l’image de telles innovations. On connaît l’activité de modération nécessaire sur les réseaux sociaux : des travailleurs (bien souvent dans des pays où la main d’œuvre est très bon marché) vérifient le contenu partagé, potentiellement choquant, avant que celui-ci ne soit disponible pour les autres internautes.

Mais l'entraînement d’une intelligence artificielle « saine » et « sans danger » pour ses utilisateurs, nécessite d’aller plus loin. La phase d’apprentissage implique la lecture automatique d’une quantité astronomique de contenus du web. Mais comment lui faire savoir qu’un contenu est offensant ? Que la description d’une scène comporte des éléments violents, sexistes ou racistes ?

La technologie n’a pour l’instant pas la réponse seule, c’est ce qu’a révélé l’enquête du Time sur les dessous de l'entraînement de ChatGPT : OpenAI a développé une deuxième IA capable de repérer ce type de contenus. Et pour l’entrainer, l’entreprise a contracté avec un prestataire américain employant des travailleurs kenyans payés entre 1.3 et 2$/heure afin de passer en revue et étiqueter par « catégories » des textes décrivant des scènes de torture, d’abus sexuels sur des enfants, de meurtres, etc.

On peut imaginer l’impact psychologique que peut représenter ce type de tâches, et ce point soulève une vraie question sur les impacts sociaux et éthiques de ces technologies.

3. Enfin, cette technologie pose une troisième question, sociétale et culturelle.

D’une part, on fait face à un manque criant de transparence : à aucun moment l’outil ne vous précise la source des données utilisées pour vous fournir sa réponse et celle-ci sera générée grâce à des centaines/milliers de contenus rédigés et structurés par des êtres humains sans les citer à un seul moment.

D’autre part, nous sommes à nouveau livrés à une technologie 100% anglo-saxonne, où une réponse européenne à la hauteur se fait malheureusement attendre, comme le met en évidence CIO online, et met à nouveau à mal la souveraineté européenne d’un point de vue technologique. Avec un corpus de données d'entraînement constitué à 46% de documents en anglais, et moins de 5% de documents en français, on peut s’interroger sur le biais et l’influence culturelle anglo-saxonne de l’outil qui va ensuite répondre à l’utilisateur français en français.

Comme nous l’avons vu dans cet article, la rupture technologique que représentent les intelligences artificielles génératives comme ChatGPT soulève de nombreuses questions qui nous donnent parfois l’impression d’être dépassés face à la rapidité de l’innovation.

Nous n’avons même pas évoqué l’impact que peuvent avoir ces outils sur nos capacités à créer, à imaginer, à faire preuve d’esprit critique, etc. Ces points ont d’ailleurs fait l’objet d’une lettre ouverte d’experts du secteur qui invitent à mettre le développement de l’IA en pause.

Comme d’autres innovations dans l’histoire de l’humanité, il semble important de se saisir collectivement de ses questions pour y répondre et faire ensemble des choix de société.