Aller au contenu

Les intemporels

20 papers et événements pour comprendre l'IA d'aujourd'hui.

Si tu pars de zéro et que tu veux comprendre comment on en est arrivé là, voici les jalons à connaître. Vingt moments fondamentaux entre 2017 et aujourd'hui : des papers qui ont changé la recherche, des produits qui ont changé l'industrie, et quelques événements qui ont changé le débat public.

  1. RechercheJuin 2017Google Brain

    « Attention Is All You Need »

    Introduit l'architecture Transformer, qui a remplacé les RNN et LSTM dans le traitement du langage. C'est la base de tous les LLM modernes : GPT, Claude, Gemini, Mistral. Un seul papier, une révolution.

    Lire la sourcearxiv.org/abs/1706.03762
  2. RechercheOctobre 2018Google

    BERT — Pre-training of Deep Bidirectional Transformers

    Premier grand modèle de langage pré-entraîné réellement utile en production. A dominé tous les benchmarks NLP pendant des années et reste la base de Google Search aujourd'hui.

    Lire la sourcearxiv.org/abs/1810.04805
  3. RechercheJanvier 2020OpenAI (Kaplan et al.)

    Scaling Laws for Neural Language Models

    Démontre mathématiquement que les performances des LLM augmentent de façon prévisible avec la taille du modèle, des données et du compute. C'est ce papier qui a justifié les budgets d'entraînement à plusieurs centaines de millions.

    Lire la sourcearxiv.org/abs/2001.08361
  4. RechercheMai 2020OpenAI

    GPT-3 — Language Models are Few-Shot Learners

    175 milliards de paramètres. Premier modèle à montrer des capacités émergentes : il apprend une nouvelle tâche à partir de quelques exemples dans le prompt, sans entraînement supplémentaire.

    Lire la sourcearxiv.org/abs/2005.14165
  5. RechercheDécembre 2020DeepMind

    AlphaFold 2 — Repliement des protéines

    Résout, avec une précision quasi-expérimentale, un problème ouvert depuis 50 ans en biologie : prédire la structure 3D d'une protéine à partir de sa séquence. Demis Hassabis et John Jumper ont reçu le prix Nobel de chimie 2024 pour ce travail.

    Lire la sourceNature, 2021
  6. ProduitJanvier 2021OpenAI

    DALL-E — Generation d'images à partir de texte

    Premier modèle text-to-image grand public à montrer des résultats spectaculaires. A ouvert la voie à Stable Diffusion, Midjourney et toute la génération créative qui a suivi.

    Lire la sourceopenai.com
  7. ProduitJuin 2021GitHub + OpenAI (Codex)

    GitHub Copilot — Premier assistant de code grand public

    Premier IDE-assistant déployé à grande échelle. Marque le début de la programmation assistée par IA, qui aboutira au « vibe coding » de 2025 avec Cursor et Claude Code.

    Lire la sourcegithub.blog
  8. RechercheMars 2022DeepMind

    Chinchilla — Le bon ratio paramètres / données

    Corrige les lois de Kaplan : pour un budget de compute donné, il est plus efficace d'entraîner un modèle plus petit sur plus de données qu'un modèle géant sur peu de données. Tous les LLM post-2022 suivent ce ratio.

    Lire la sourcearxiv.org/abs/2203.15556
  9. ProduitAoût 2022Stability AI / CompVis

    Stable Diffusion — Text-to-image open-source

    Premier modèle text-to-image puissant publié en open-source. Démocratise massivement la génération d'images : tout le monde peut le faire tourner sur son GPU. Lance l'écosystème de l'image IA libre.

    Lire la sourcestability.ai
  10. RechercheDécembre 2022Anthropic

    Constitutional AI — Le RLHF augmenté par une IA

    Méthode d'alignement des modèles qui remplace une partie du feedback humain par des principes écrits (la « constitution »). Base de l'entraînement de Claude. Plus scalable que le RLHF classique.

    Lire la sourcearxiv.org/abs/2212.08073
  11. Produit30 novembre 2022OpenAI

    ChatGPT — L'IA entre dans la culture populaire

    100 millions d'utilisateurs en deux mois, le produit grand public qui a connu la plus rapide adoption de l'histoire. Le moment où l'IA cesse d'être un sujet technique et devient un sujet de société.

    Lire la sourceopenai.com
  12. ProduitFévrier 2023Meta

    LLaMA — Naissance de l'écosystème ouvert

    Premier modèle open-weights compétitif avec GPT-3. Initialement leaké, puis officiellement ouvert avec LLaMA 2. Lance toute la galaxie des LLM ouverts qui font tourner l'IA hors des grands clouds.

    Lire la sourceai.meta.com
  13. ProduitMars 2023OpenAI

    GPT-4 — Le premier LLM mature

    Multimodal, score top 10% au barreau américain, raisonnement transparent supérieur. Première fois qu'un LLM atteint un niveau professionnel sur un large éventail de tâches. Le standard auquel se sont mesurés tous les modèles suivants.

    Lire la sourceopenai.com
  14. ProduitSeptembre 2023Mistral AI

    Mistral 7B — La France entre dans la course

    Premier modèle ouvert européen compétitif au niveau mondial. 7 milliards de paramètres, performances dignes de modèles deux fois plus gros. Lance la souveraineté IA européenne.

    Lire la sourcemistral.ai
  15. ProduitMars 2024Anthropic

    Claude 3 — Anthropic dépasse OpenAI

    Première fois qu'un modèle non-OpenAI dépasse GPT-4 sur la plupart des benchmarks. Ouvre une vraie compétition au sommet et installe Claude comme alternative crédible pour les usages professionnels.

    Lire la sourceanthropic.com
  16. ÉvénementAoût 2024Union européenne

    AI Act — Premier cadre réglementaire mondial

    Premier règlement contraignant sur l'IA dans le monde. Classifie les systèmes par niveau de risque (inacceptable, élevé, limité, minimal) avec des obligations correspondantes. Effet Bruxelles : devient une référence pour les régulateurs partout dans le monde.

    Lire la sourceartificialintelligenceact.eu
  17. ProduitSeptembre 2024OpenAI

    OpenAI o1 — Le scaling au temps d'inférence

    Premier modèle de raisonnement grand public. Au lieu de répondre instantanément, il « réfléchit » plusieurs minutes en générant une chaîne de pensée interne. Ouvre un nouveau paradigme : on peut améliorer les performances en investissant plus de calcul à l'inférence, pas seulement à l'entraînement.

    Lire la sourceopenai.com
  18. ProduitOctobre 2024Anthropic

    Computer Use — L'âge des agents commence

    Premier modèle grand public capable de contrôler un ordinateur (souris, clavier, screenshots) pour accomplir des tâches en autonomie. Marque le passage du LLM-assistant au LLM-agent qui agit dans le monde numérique.

    Lire la sourceanthropic.com
  19. ProduitDécembre 2024OpenAI

    Sora — Text-to-video à qualité cinéma

    Premier modèle text-to-video à produire des vidéos longues, cohérentes et photoréalistes. Démontre que les modèles de diffusion peuvent capturer non seulement des images mais aussi la dynamique du monde réel.

    Lire la sourceopenai.com
  20. ProduitJanvier 2025DeepSeek

    DeepSeek R1 — Le choc open-source chinois

    Modèle de raisonnement chinois en open-weights, performance comparable à OpenAI o1, à un coût d'entraînement supposé bien plus faible. Provoque la plus forte chute boursière de Nvidia en une journée. Confirme que l'open-source rattrape les leaders propriétaires.

    Lire la sourcedeepseek.com

La suite, chaque jeudi.

Hypernews IA documente les nouvelles étapes en temps réel. Pour ne rater aucun jalon de l'histoire en cours, inscris-toi.

S'inscrire gratuitement