Les intemporels

20 papers et événements pour comprendre l'IA d'aujourd'hui.

Si tu pars de zéro et que tu veux comprendre comment on en est arrivé là, voici les jalons à connaître. Vingt moments fondamentaux entre 2017 et aujourd'hui : des papers qui ont changé la recherche, des produits qui ont changé l'industrie, et quelques événements qui ont changé le débat public.

RechercheJuin 2017Google Brain
« Attention Is All You Need »
Introduit l'architecture Transformer, qui a remplacé les RNN et LSTM dans le traitement du langage. C'est la base de tous les LLM modernes : GPT, Claude, Gemini, Mistral. Un seul papier, une révolution.
Lire la sourcearxiv.org/abs/1706.03762
RechercheOctobre 2018Google
BERT — Pre-training of Deep Bidirectional Transformers
Premier grand modèle de langage pré-entraîné réellement utile en production. A dominé tous les benchmarks NLP pendant des années et reste la base de Google Search aujourd'hui.
Lire la sourcearxiv.org/abs/1810.04805
RechercheJanvier 2020OpenAI (Kaplan et al.)
Scaling Laws for Neural Language Models
Démontre mathématiquement que les performances des LLM augmentent de façon prévisible avec la taille du modèle, des données et du compute. C'est ce papier qui a justifié les budgets d'entraînement à plusieurs centaines de millions.
Lire la sourcearxiv.org/abs/2001.08361
RechercheMai 2020OpenAI
GPT-3 — Language Models are Few-Shot Learners
175 milliards de paramètres. Premier modèle à montrer des capacités émergentes : il apprend une nouvelle tâche à partir de quelques exemples dans le prompt, sans entraînement supplémentaire.
Lire la sourcearxiv.org/abs/2005.14165
RechercheDécembre 2020DeepMind
AlphaFold 2 — Repliement des protéines
Résout, avec une précision quasi-expérimentale, un problème ouvert depuis 50 ans en biologie : prédire la structure 3D d'une protéine à partir de sa séquence. Demis Hassabis et John Jumper ont reçu le prix Nobel de chimie 2024 pour ce travail.
Lire la sourceNature, 2021
ProduitJanvier 2021OpenAI
DALL-E — Generation d'images à partir de texte
Premier modèle text-to-image grand public à montrer des résultats spectaculaires. A ouvert la voie à Stable Diffusion, Midjourney et toute la génération créative qui a suivi.
Lire la sourceopenai.com
ProduitJuin 2021GitHub + OpenAI (Codex)
GitHub Copilot — Premier assistant de code grand public
Premier IDE-assistant déployé à grande échelle. Marque le début de la programmation assistée par IA, qui aboutira au « vibe coding » de 2025 avec Cursor et Claude Code.
Lire la sourcegithub.blog
RechercheMars 2022DeepMind
Chinchilla — Le bon ratio paramètres / données
Corrige les lois de Kaplan : pour un budget de compute donné, il est plus efficace d'entraîner un modèle plus petit sur plus de données qu'un modèle géant sur peu de données. Tous les LLM post-2022 suivent ce ratio.
Lire la sourcearxiv.org/abs/2203.15556
ProduitAoût 2022Stability AI / CompVis
Stable Diffusion — Text-to-image open-source
Premier modèle text-to-image puissant publié en open-source. Démocratise massivement la génération d'images : tout le monde peut le faire tourner sur son GPU. Lance l'écosystème de l'image IA libre.
Lire la sourcestability.ai
RechercheDécembre 2022Anthropic
Constitutional AI — Le RLHF augmenté par une IA
Méthode d'alignement des modèles qui remplace une partie du feedback humain par des principes écrits (la « constitution »). Base de l'entraînement de Claude. Plus scalable que le RLHF classique.
Lire la sourcearxiv.org/abs/2212.08073
Produit30 novembre 2022OpenAI
ChatGPT — L'IA entre dans la culture populaire
100 millions d'utilisateurs en deux mois, le produit grand public qui a connu la plus rapide adoption de l'histoire. Le moment où l'IA cesse d'être un sujet technique et devient un sujet de société.
Lire la sourceopenai.com
ProduitFévrier 2023Meta
LLaMA — Naissance de l'écosystème ouvert
Premier modèle open-weights compétitif avec GPT-3. Initialement leaké, puis officiellement ouvert avec LLaMA 2. Lance toute la galaxie des LLM ouverts qui font tourner l'IA hors des grands clouds.
Lire la sourceai.meta.com
ProduitMars 2023OpenAI
GPT-4 — Le premier LLM mature
Multimodal, score top 10% au barreau américain, raisonnement transparent supérieur. Première fois qu'un LLM atteint un niveau professionnel sur un large éventail de tâches. Le standard auquel se sont mesurés tous les modèles suivants.
Lire la sourceopenai.com
ProduitSeptembre 2023Mistral AI
Mistral 7B — La France entre dans la course
Premier modèle ouvert européen compétitif au niveau mondial. 7 milliards de paramètres, performances dignes de modèles deux fois plus gros. Lance la souveraineté IA européenne.
Lire la sourcemistral.ai
ProduitMars 2024Anthropic
Claude 3 — Anthropic dépasse OpenAI
Première fois qu'un modèle non-OpenAI dépasse GPT-4 sur la plupart des benchmarks. Ouvre une vraie compétition au sommet et installe Claude comme alternative crédible pour les usages professionnels.
Lire la sourceanthropic.com
ÉvénementAoût 2024Union européenne
AI Act — Premier cadre réglementaire mondial
Premier règlement contraignant sur l'IA dans le monde. Classifie les systèmes par niveau de risque (inacceptable, élevé, limité, minimal) avec des obligations correspondantes. Effet Bruxelles : devient une référence pour les régulateurs partout dans le monde.
Lire la sourceartificialintelligenceact.eu
ProduitSeptembre 2024OpenAI
OpenAI o1 — Le scaling au temps d'inférence
Premier modèle de raisonnement grand public. Au lieu de répondre instantanément, il « réfléchit » plusieurs minutes en générant une chaîne de pensée interne. Ouvre un nouveau paradigme : on peut améliorer les performances en investissant plus de calcul à l'inférence, pas seulement à l'entraînement.
Lire la sourceopenai.com
ProduitOctobre 2024Anthropic
Computer Use — L'âge des agents commence
Premier modèle grand public capable de contrôler un ordinateur (souris, clavier, screenshots) pour accomplir des tâches en autonomie. Marque le passage du LLM-assistant au LLM-agent qui agit dans le monde numérique.
Lire la sourceanthropic.com
ProduitDécembre 2024OpenAI
Sora — Text-to-video à qualité cinéma
Premier modèle text-to-video à produire des vidéos longues, cohérentes et photoréalistes. Démontre que les modèles de diffusion peuvent capturer non seulement des images mais aussi la dynamique du monde réel.
Lire la sourceopenai.com
ProduitJanvier 2025DeepSeek
DeepSeek R1 — Le choc open-source chinois
Modèle de raisonnement chinois en open-weights, performance comparable à OpenAI o1, à un coût d'entraînement supposé bien plus faible. Provoque la plus forte chute boursière de Nvidia en une journée. Confirme que l'open-source rattrape les leaders propriétaires.
Lire la sourcedeepseek.com

La suite, chaque jeudi.

Hypernews IA documente les nouvelles étapes en temps réel. Pour ne rater aucun jalon de l'histoire en cours, inscris-toi.

S'inscrire gratuitement

20 papers et événements pour comprendre l'IA d'aujourd'hui.

« Attention Is All You Need »

BERT — Pre-training of Deep Bidirectional Transformers

Scaling Laws for Neural Language Models

GPT-3 — Language Models are Few-Shot Learners

AlphaFold 2 — Repliement des protéines

DALL-E — Generation d'images à partir de texte

GitHub Copilot — Premier assistant de code grand public

Chinchilla — Le bon ratio paramètres / données

Stable Diffusion — Text-to-image open-source

Constitutional AI — Le RLHF augmenté par une IA

ChatGPT — L'IA entre dans la culture populaire

LLaMA — Naissance de l'écosystème ouvert

GPT-4 — Le premier LLM mature

Mistral 7B — La France entre dans la course

Claude 3 — Anthropic dépasse OpenAI

AI Act — Premier cadre réglementaire mondial

OpenAI o1 — Le scaling au temps d'inférence

Computer Use — L'âge des agents commence

Sora — Text-to-video à qualité cinéma

DeepSeek R1 — Le choc open-source chinois

La suite, chaque jeudi.