LLM. Ce sigle revient dans toutes les conversations sur l’IA. Large Language Model. Mais concrètement, c’est quoi ? Et pourquoi c’est important de comprendre ça ?
La définition simple
Un LLM c’est un programme informatique qui a été entraîné sur d’énormes quantités de texte pour apprendre à prédire quel mot vient après un autre. C’est tout.
ChatGPT, Claude, Gemini, Llama — ce sont tous des LLMs. Des programmes qui ont « lu » des milliards de pages de texte et qui peuvent maintenant produire du texte cohérent en réponse à tes questions.
Comment ça « apprend » ?
Imagine que tu lis 1 million de livres. À force, tu commences à avoir des intuitions sur comment les phrases s’enchaînent, comment les idées se connectent, comment un expert parle de son domaine.
Un LLM fait pareil, mais à une échelle inhumaine. Il analyse des patterns statistiques dans des milliards de textes, et apprend à reproduire ces patterns.
C’est comme un étudiant ultra-doué qui a tout lu mais qui n’a jamais vécu. Il peut parler de la douleur sans jamais l’avoir ressentie, expliquer comment faire du vélo sans jamais en avoir fait.
Pourquoi il hallucine ?
C’est la grande limite des LLMs. Quand le modèle ne sait pas quelque chose, il ne dit pas « je ne sais pas ». Il génère ce qui lui semble statistiquement probable — même si c’est faux.
Il invente une source qui ressemble à une vraie source. Un fait qui ressemble à un vrai fait. Une date qui ressemble à une vraie date. C’est pour ça qu’on dit qu’il « hallucine ».
La différence entre un petit et un grand LLM
Le « L » de LLM signifie « Large » — grand. Plus un modèle a de « paramètres » (la façon de mesurer sa taille), plus il est généralement performant. GPT-4 a des centaines de milliards de paramètres. Un petit modèle en a quelques milliards.
Mais la taille ne fait pas tout. L’entraînement, les données utilisées, l’optimisation après entraînement (RLHF) — tout ça compte autant que la taille brute.
Ce que ça change pour toi
Comprendre qu’un LLM prédit des mots plutôt qu’il ne « pense » t’aide à mieux l’utiliser :
- Tu sais pourquoi il faut toujours vérifier les faits importants
- Tu comprends pourquoi un prompt précis donne de meilleurs résultats
- Tu sais qu’il n’a pas d’opinion réelle, juste des patterns statistiques
LLM = programme qui prédit des mots. Très fort pour générer du texte cohérent. Pas fiable à 100% sur les faits précis. À utiliser avec un oeil critique.