Comprendre l'IA : Première partie | Collège Revesz-Long

Vous avez peut-être déjà utilisé ChatGPT ou d'autres assistants intelligents ? Ces programmes impressionnent : en quelques secondes, ils rédigent un texte, répondent à des questions difficiles ou créent un poème.

Devant ces performances, on a vite fait de penser que la machine "comprend" vraiment ce qu'on lui demande, qu'elle "réfléchit" comme nous. Pourtant, ce n'est pas exactement ça...

En réalité : une super calculatrice de mots

Pourtant, cette impression est trompeuse. Derrière l'écran, il n'y a pas de conscience, pas de vraie réflexion. Il y a surtout... des calculs mathématiques.

Une intelligence artificielle comme ChatGPT, ce n'est pas un cerveau électronique. C'est plutôt une machine qui devine le mot suivant. Comment ? En calculant quelle suite de mots apparaît le plus souvent dans les textes qu'elle a appris par cœur.

Imaginez : vous écrivez "Le chat mange ses..." L'IA calcule que le mot "croquettes" apparaît très souvent après cette phrase. Elle ne comprend pas ce qu'est un chat ou la nourriture. Elle repère juste des régularités, comme une calculatrice ultra-perfectionnée.

L'IA ne cherche pas la vérité. Elle cherche la suite de mots la plus probable.

Partie 1 : Lui faire reconnaître une image

Comment l'IA "apprend" à reconnaître les choses ?

Pour comprendre comment fonctionne une intelligence artificielle, il faut oublier notre façon de voir le monde. Nous, on voit un chat, un paysage, un sourire. L'IA, elle, ne voit que des chiffres.

Prenons un exemple simple : comment l'IA reconnaît-elle un chat sur une photo ?

Étape 1 : Tout transformer en chiffres

Imaginons qu'on montre à l'ordinateur un dessin simple d'un chat. Il ne "voit" rien du tout ! À la place, il mesure l'image et la transforme en liste de données :

Formes détectées : 2 triangles (les oreilles), 2 ronds (les yeux), 1 ovale (la tête)
Positions : les triangles sont en haut, les ronds au milieu
Distances : l'espace entre les deux yeux

À ce moment-là, l'ordinateur ne sait pas ce qu'est un chat. Il a juste une série de mesures, comme : [2 triangles, 2 cercles, distance = 3 cm...].

Étape 2 : Apprendre en regardant des milliers d'exemples

Ensuite, on montre à l'IA des dizaines de milliers de photos de chats. À chaque fois, elle mesure et compare. Ses calculs détectent automatiquement des régularités statistiques :

2 triangles pointus au-dessus apparaissent dans 95% des cas
Les 2 ronds sont alignés dans 98% des cas
Cette forme ovale est présente dans 97% des cas

Vous avez déjà aidé une IA à apprendre ! Vous connaissez les CAPTCHA ? Ces tests où on vous demande de cocher "toutes les images avec des feux tricolores" ou "toutes les cases avec un vélo" ? En réalité, vous êtes en train d'entraîner une intelligence artificielle ! Vos réponses lui permettent d'associer des images à des étiquettes.

L'IA ne comprend toujours pas ce qu'est un chat. Mais ses paramètres mathématiques se sont ajustés pour calculer : "Cette combinaison de formes = probabilité élevée que ce soit un chat."

Étape 3 : Classer par familles

Une fois l'entraînement terminé, l'IA range tout ce qu'elle a vu dans un grand tableau imaginaire. Ses calculs créent automatiquement des "familles" :

La famille "Chat" : toutes les images avec [triangles pointus + museau court + moustaches]
La famille "Chien" : proche de celle du chat (yeux, oreilles, pattes) mais avec des différences mesurables (museau plus long, oreilles différentes)
La famille "Piano" : très loin des deux autres (formes rectangulaires, touches noires et blanches)

Tout ça reste des calculs mathématiques. L'IA ne sait toujours pas qu'un chat miaule ou qu'il aime dormir au soleil !

Partie 2 : Comment l'IA traite le langage ?

On a vu comment l'IA transforme des images en chiffres. Mais comment fait-elle pour comprendre du texte et écrire des phrases ? Le principe est le même : transformer les mots en nombres calculables.

Étape 1 : Découper le texte en morceaux (la tokenisation)

Pour une image de chat, l'ordinateur détectait des formes de base : triangles, cercles, ovales.

Pour le texte, c'est pareil ! La machine découpe chaque phrase en petits morceaux appelés tokens (jetons).

Un mot simple = 1 token : "chat"
Un mot compliqué = plusieurs tokens :
- "Anticonstitutionnellement" devient : [Anti] + [constitu] + [tion] + [nelle] + [ment]

À ce stade, l'IA ne "lit" pas vraiment. Elle manipule juste des petites briques de texte, comme des pièces de Lego.

Étape 2 : Placer chaque mot sur une carte géométrique (la vectorisation)

C'est la partie la plus importante ! Comment l'IA comprend-elle que "roi" et "reine" sont liés, mais que "banane" n'a rien à voir ?

L'IA transforme chaque mot en coordonnées GPS dans un espace imaginaire.

Imaginez une carte géante en plusieurs dimensions (impossible à dessiner, mais elle existe mathématiquement). Sur cette carte :

Le mot "Roi" a des coordonnées précises : par exemple [0.8, 0.3, -0.5, 0.9...] (en réalité, il y a des centaines de chiffres)
Le mot "Reine" a des coordonnées très proches : [0.7, 0.4, -0.4, 0.9...]
Le mot "Trône" est aussi tout près sur cette carte
Le mot "Banane" est très loin : [0.1, -0.8, 0.2, -0.3...]

Comment la machine place-t-elle les mots sur cette carte ?

En lisant des milliards de phrases pendant son entraînement ! L'ordinateur calcule automatiquement :

Quels mots apparaissent souvent ensemble
Quels mots sont utilisés dans les mêmes contextes
Quelles relations existent entre les mots

Par exemple, dans les textes qu'elle a lus :

"Roi" apparaît souvent près de "château", "couronne", "pouvoir"
"Reine" apparaît dans des contextes similaires
Donc leurs coordonnées mathématiques deviennent proches

C'est comme si l'IA créait des quartiers de mots :

Le quartier de la royauté : roi, reine, prince, château...
Le quartier des fruits : pomme, banane, orange...
Le quartier des animaux : chat, chien, oiseau...

La magie des calculs sur les mots

Le plus impressionnant ? On peut faire des calculs mathématiques avec ces coordonnées !

Un exemple :

Coordonnées de "Roi" - Coordonnées de "Homme" + Coordonnées de "Femme" = ?

Le résultat du calcul tombe presque exactement sur... "Reine" !

Pourquoi ça marche ? Parce que :

"Roi" contient l'idée de [royauté + masculin]
On retire "Homme" (le masculin)
On ajoute "Femme" (le féminin)
Il reste [royauté + féminin] = "Reine"

Mais attention : l'IA ne comprend toujours rien !

L'ordinateur ne sait pas qu'un roi porte une couronne ou qu'une banane se mange. Il a juste calculé que ces mots doivent être placés à tel ou tel endroit sur sa carte mathématique, parce que c'est ce que les statistiques de ses textes d'entraînement indiquent.

C'est une illusion parfaite : l'IA semble "comprendre" les relations entre les mots, mais elle ne fait que mesurer des distances mathématiques !

En résumé : Une carte, ce n'est pas encore un GPS

Récapitulons ce qu'on a découvert sur le fonctionnement de l'intelligence artificielle :

Pour l'IA, une photo de chat = une liste de formes géométriques (triangles, cercles)
Pour l'IA, un texte = une immense carte avec des coordonnées mathématiques pour chaque mot

L'exploit de l'IA, c'est d'avoir réussi à transformer notre langage (avec toutes ses subtilités) en une gigantesque base de données de chiffres.

Mais une question reste en suspens...

Avoir un dictionnaire bien rangé, ce n'est pas savoir écrire un livre !

L'IA sait où sont placés tous les mots sur sa carte mathématique. Très bien. Mais alors :

Comment choisit-elle le mot suivant quand elle vous répond ?
Comment passe-t-elle d'une simple liste de mots à une vraie conversation ?
Et surtout : pourquoi peut-elle dire avec la même assurance une information vraie... et une grosse erreur ?

Dans le prochain article

Nous verrons comment l'IA construit ses réponses. Nous découvrirons que derrière ses phrases qui semblent réfléchies, il y a surtout un système de calcul de probabilités. L'IA ne "pense" pas : elle calcule quel mot a le plus de chances d'apparaître après le précédent.