Durée de lecture : 10 minutes.
Bonjour,
Vous lisez IA Mania, la newsletter qui décrypte chaque lundi les enjeux business et marketing de l’intelligence artificielle.
Au programme de cette édition :
 Le Noël de l’IA
 Le Noël de l’IA
Après O1 vient O3.
Logique ?
Non, mais c’est OpenAI, la startup la plus innovante, controversée, et énigmatique, de l’univers (oui de l’univers tout entier).
Alors, ils font ce qu’ils veulent.
Pour Noël, OpenAI nous a offert 12 cadeaux, étalés sur 12 jours.
Un petit calendrier de l’avent l’IA si on puit dire.
Le tout dernier cadeau était une annonce fracassante : O3, la dernière mouture de ChatGPT.
Un modèle si puissant que même le plus puissant superordinateur du monde se fatigue à le faire tourner.
Certains disent que c’est lui la dernière étape avant une réelle intelligence artificelle générale…
Vous savez ce qu’on pense de ça.
La danse reste la même, mais elle s’intensifie.
Des progrès spectaculaires freinés uniquement par des défis techniques colossaux.
Des valorisations stratosphériques qui peinent à compenser des pertes abyssales.
Pour OpenAI, le timing n’est pas anodin.
Google vient de sortir Gemini, Anthropic perfectionne Claude, et les modèles open source comme Llama et Grok rattrapent leur retard.
La concurrence n’a jamais été aussi féroce.
Ces 12 jours ressemblent donc autant à une célébration qu’à une démonstration de force.
Dans cette édition spéciale Noël, on recap ces 12 annonces si vous les avez ratées, et comme d’habitude, on les décrypte.
O3, Sora, ChatGPT sur Whatsapp, batailles juridiques, défis d’infrastructure, course à l’innovation, OpenAI joue son avenir.
Et peut-être le nôtre (sans IA, pas de newsletter d’IA).
 Jour 1 : un cadeau empoisonné ?
O1 Preview, que vous avez pu tester, prenait parfois 10 secondes pour répondre « Bonjour », comme s’il devait considérer la théorie des cordes à chaque interaction.
Donc, le premier cadeau du calendrier, la version finale d’O1 livrée sous le sapin.
O1 :
- est 50% plus rapide que son prédécesseur
- fait 34% moins d’erreurs sur les tâches complexes
- a enfin la capacité d’analyser des images.
Mais ce n’est pas tout ! Les temps sont durs en laponie, donc le deuxième cadeau, c’est un abonnement ChatGPT Pro à 200$ par mois.
Pour ce prix vous aurez :
- un accès illimité à leurs meilleurs modèles
- le mode voix avancé
- O1 PR Mode : une version survitaminée pour les problèmes complexes
Néanmoins, à moins d’être chercheur ou développeur poussant ces modèles dans leurs derniers retranchements, gardez vos 200$ pour les cadeaux de Noël.
Les tests indépendants montrent une amélioration de 20-30% sur les tâches complexes (mathématiques avancées), mais pour les tâches simples (rédiger un mail, un contenu), rien de nouveau à signaler.
Les bruits de couloirs suggèrent qu’OpenAI cherche à monétiser les utilisateurs professionnels pour compenser les pertes d’infrastructure.
Malgré une valorisation à 157 milliards, et 300 millions de CA mensuel générés, la startup reste en perte et pourrait fermer boutique l’année prochaine si elle ne trouve pas de nouveaux investisseurs ou une nouvelle source de revenus, vite.
 Jour 2 : GPT stéroïdé
La nouveauté du jour 2, c’est le « reinforcement fine-tuning”.
L’idée, c’est de permettre aux entreprises et chercheurs d’entraîner O1 sur leurs propres données.
Un peu comme un GPT, mais mieux.
Pour l’instant les résultats sont spectaculaires : avec seulement quelques dizaines d’exemples, O1 devient expert dans un domaine spécifique. On parle d’une amélioration de performances de +75% sur certaines tâches.
L’université de Berkeley, utilise cette fonctionnalité pour identifier les gènes responsables de maladies rares.
OpenAI prévoit de rendre le “reinforcement fine-tuning” accessible au public dès début 2024.
 Jour 3 : Sora
Ça y est. On nous l’a teasé toute l’année, maintenant, il est là.
Sora c’est le générateur de vidéos qui redéfinit la fabrique de la réalité. Annoncé comme tellement puissant qu’il pourrait causer des bouleversements sociétaux majeurs.
Alors, qu’est-ce que ça vaut ?
Côté fonctionnalités :
- génération de vidéos jusqu’à 20 secondes en 1080p
- création via texte ou à partir d’images
- un storyboard pour diriger précisément vos scènes
- des outils de remix pour modifier vos créations
- une fonction blend pour fusionner deux vidéos
Néanmoins, comme on pouvait s’y attendre, si vous espériez générer le prochain blockbuster hollywoodien en un clic, ce n’est pas encore pour cette année.
Sora n’a l’air d’être qu’au début de son histoire.
La plupart des forces sont les mêmes que celles d’un RunwayML.
La plupart des faiblesses aussi.
Sauf que Sora coûte 6 fois plus cher.
Pour des générations illimitées vous devrez souscrire à un abonnement pro à 200$/mois.
Pour nous la question ne se pose pas, Sora n’est pas encore disponible en Europe.
Pour Sam Altman, Sora représente une étape cruciale vers l’AGI. Après tout, comprendre et générer des vidéos réalistes nécessite une compréhension profonde du monde physique, de ses règles et de ses interactions.
 Jour 4 : les Canvas toile pour créer avec l’IA
Un Canvas, c’est espace de collaboration créative avec ChatGPT.
Un document partagé où vous et ChatGPT pouvez travailler côte à côte. À gauche, votre discussion. À droite, un espace de création où vous pouvez :
- Écrire et éditer du texte ensemble
- Exécuter du code Python directement dans l’interface
- Recevoir des commentaires précis sur votre travail
- Demander des modifications directement sur votre document
Cerise sur la bûche de Noël : Canvas est désormais intégré aux GPTs personnalisés.
Notre grain de sel : la fonctionnalité est un hommage/plagiat parfait à/de Claude.
 Jour 5 : la tech préférée des docteurs
OpenAI et Apple dévoilent une intégration complète de ChatGPT dans iOS et macOS.
Trois cadeaux sous le sapin pommé :
1 – Siri + ChatGPT
Quand Siri sent qu’une tâche dépasse ses capacités, il peut désormais passer le relais à ChatGPT.
2 – Les outils d’écriture s’enrichissent
Résumés, compositions, améliorations de texte… ChatGPT vous assiste nativement dans vos documents.
3 – L’appareil photo devient plus intelligent
Sur iPhone 16, un appui long sur le bouton de l’appareil photo active l’intelligence visuelle de ChatGPT.
Ce qui est sympa c’est qu’il n’y a pas besoin de compte pour en profiter (même si en avoir un débloque plus de fonctionnalités).
La mise à jour est disponible dès aujourd’hui… sauf pour l’Europe.
On passe à la suite.
 Jour 6 : ho ho ho, je vais tous vous remplacer
La vidéo arrive dans le mode voix avancé…
ChatGPT peut désormais vous voir et regarder votre écran.
Je sais, flippant.
- Les appels vidéo en direct avec ChatGPT
- Le partage d’écran pour obtenir de l’aide contextuelle
- Une compréhension plus naturelle grâce à la vision des expressions et gestes
Pour l’instant on n’a que la démo de l’équipe interne : de l’apprentissage de la préparation du café à l’aide à la rédaction de messages, ChatGPT s’adapte au contexte visuel avec une fluidité déconcertante.
Comme toujours avec OpenAI, il vaut mieux attendre le test du terrain avant de s’emballer.
La fonctionnalité n’est pas dispo en Europe.
Ah, vous pouvez aussi parler au Père Noël tout le mois de décembre, une fonctionnalité sympa si vous avez des enfants (ou si vous vous sentez seuls pour Noël).
 Jour 7 : les projets ChatGPT
Les projets, c’est une mise à jour bienvenue pour mieux organiser nos espaces de travail sur ChatGPT.
Les projets permettent :
- d’organiser vos conversations par thème
- uploader des fichiers spécifiques à chaque projet
- définir des instructions personnalisées projet par projet
L’équipe a montré deux exemples concrets :
Organisation d’un Secret Santa
- Upload des souhaits de cadeaux
- Assignation aléatoire des participants
- Recherche de suggestions de cadeaux
- Rédaction des emails d’organisation via Canvas
Maintenance d’appartement
- Documentation des appareils
- Journal de maintenance
- ChatGPT peut rappeler quand changer le filtre du frigo en se basant sur l’historique
La fonctionnalité est déployée dès aujourd’hui pour les abonnés Plus, Pro et Teams.
 Jour 8 : ChatGPT sur internet
Après deux mois de tests avec les utilisateurs payants, la recherche web arrive enfin pour tous.
Une recherche plus performante
- Navigation plus rapide
- Expérience mobile optimisée
- Nouvelles fonctionnalités de cartes
- Résultats enrichis avec images et vidéos
La recherche vocale
L’IA peut désormais rechercher des informations en temps réel pendant vos conversations vocales. Une démo impressionnante a montré comment planifier des vacances à Zurich ou New York simplement en discutant !
La recherche pour tous
La plus grande annonce : la recherche web est maintenant disponible gratuitement pour tous les utilisateurs connectés, sur toutes les plateformes (web, iOS, Android).
Pour l’utiliser :
- Posez votre question normalement
- ChatGPT détermine automatiquement s’il doit chercher sur le web
- Vous pouvez aussi forcer la recherche avec un bouton dédié
 Jour 9 : des cadeaux pour les développeurs
Les 2 millions de développeurs utilisant l’API à travers 200 pays sont les plus gâtés par ce calendrier de l’avent.
Si vous n’êtes pas développeur, vous pouvez sauter cette section, elle est assez technique.
O1 sort de sa preview
Le modèle phare d’OpenAI arrive en version finale dans l’API avec :
- Function calling amélioré
- Sorties structurées (JSON)
- Messages développeur (nouveau type d’instructions)
- Paramètre d’effort de raisonnement
- Compréhension d’images
- 60% de tokens en moins = applications plus rapides et moins chères
API temps réel plus accessible
L’API pour créer des interactions vocales s’améliore :
- Support WebRTC pour une intégration plus simple (12 lignes de code vs 200+)
- Baisse des prix de 60% pour GPT-4
- Nouveau modèle GPT-4 mini 10x moins cher
- SDK Python officiel
Personnalisation par préférences
Nouvelle méthode de fine-tuning basée sur les préférences :
- Au lieu de fournir des paires input/output exactes, on indique des réponses préférées/non préférées
- Idéal pour le support client, la modération, l’écriture créative
- Disponible aujourd’hui pour GPT-4, bientôt pour GPT-4 mini
Autres surprises sous le sapin
Fun fact : pourquoi les sorties structurées étaient sur la liste des vilains du Père Noël ? Parce que c’était un « schema » ! (schemer = celui qui complote)
 Jour 10 : ChatGPT répond au téléphone !
Un petit coup marketing sympathique pour populariser l’IA auprès des populations moins “tech” qui pourront maintenant envoyer des requêtes à ChatGPT par SMS et WhatsApp.
La ligne du père ChatGPT
- Composez le 1-800-CHATGPT (1-800-242-8478) aux États-Unis
- 15 minutes gratuites par mois
- Fonctionne sur TOUS les téléphones (même sur Nokia 3310, ça c’est intéressant)
L’équipe a fait une démonstration amusante en appelant depuis :
- Un iPhone moderne
- Un vieux téléphone à clapet
- Un téléphone à cadran rotatif des années 60
ChatGPT sur WhatsApp
- Disponible mondialement
- Pas besoin de compte pour commencer
- Utilise GPT-4o mini
Cette nouveauté est née d’un projet hackathon il y a quelques semaines, et l’équipe s’est précipitée pour le rendre disponible avant les fêtes.
Note : c’est l’excuse parfaite pour expliquer à votre n+1 pourquoi vous passez tout ce temps à consulter vos messages.
 Jour 11 : ChatGPT au bureau
Quand on dit bureau, on entend desktop.
ChatGPT, desktop.
Les nouveautés :
Invoquez ChatGPT en un raccourci clavier (Option + Espace), pas de navigateur à ouvrir, pas de contexte à switcher. Très bienvenu si vous êtes facilement éparpillé comme moi.
Vous pourrez aussi parler à ChatGPT en mode voix tout en utilisant vos autres apps, une fonctionnalité que j’utilise de plus en plus et qui rend la nécessité de créer le fameux “prompt parfait” de moins en moins pertinente.
Côté intégration :
- Votre IDE préféré (Xcode, VS Code, la suite JetBrains)
- Vos notes (Apple Notes, Notion, Quip)
- Votre terminal (Warp)
Le plus impressionnant à nos yeux c’est la compréhension contextuelle.
ChatGPT lit votre écran et comprend ce que vous faites.
Toutes ces fonctionnalités sont disponibles dès maintenant sur Mac.
Windows ? « Bientôt », comme disent les développeurs.
Autrement dit, prévoir large.
 Jour 12 : O3, le futur
On termine par le plus grand cadeau… ou le plus grand danger.
O3 est là.
Enfin, presque là.
Les chiffres sont vertigineux :
- Il pulvérise les meilleurs programmeurs sur CodeForces avec un elo de 2727 (tout simplement incroyable)
- Il résout des problèmes de doctorat aussi bien que des docteurs (87.7% sur GPQA Diamond)
- Il est le premier à dépasser l’humain sur l’ARC Challenge, un benchmark qu’on pensait tout bonnement impossible à battre
Impressionnant ? Oui. Effrayant ? Surtout.
Pour faire tourner O3, même El Capitan, le plus puissant superordinateur au monde, pourrait transpirer.
On parle d’une puissance de calcul qui défie l’imagination.
Mais OpenAI a prévu une alternative plus accessible : O3 mini.
Comme son grand frère, en plus petit, plus rapide, moins gourmand.
Les performances seraient comparables à O1, mais beaucoup plus rapide, et pour une fraction du coût.
Pour l’instant, O3 n’est disponible que via un programme de test public pour chercheurs en sécurité qui testent tne nouvelle technique appelée « deliberative alignment » pour s’assurer que le modèle ne nous tue pas tous à la seconde où nous le rendons accessible.
Si tout va bien, un lancement public est prévu « fin janvier ».
Conclusion
Pour moi, un point crucial manque à l’appel dans toutes ces annonces : quid de la fiabilité sur les tâches simples ?
OpenAI nous éblouit avec des scores impressionnants sur des problèmes de niveau doctorat.
Mais honnêtement ? Un taux de réussite de 99.9999% sur des problèmes de primaire serait bien plus révolutionnaire que 87% sur des problèmes de doctorat.
C’est là que réside le véritable potentiel d’automatisation : non pas dans la résolution occasionnelle de problèmes complexes, mais dans l’exécution fiable et sans supervision de tâches quotidiennes.
Ces benchmarks brillent par leur absence. Est-ce un oubli ? Ou peut-être que les résultats ne sont pas aussi impressionnants qu’on voudrait nous le faire croire.
En attendant, on notera qu’après O1, OpenAI a sauté directement à O3. O2 ? Personne ne sait.
O – Les outils qu’on recommandera toujours
- GPT-4 : environ 20% de cette édition est écrite en collaboration avec.
- Claude : 20 à 30% de cette édition est écrite en collaboration avec.
- Midjourney : qu’avez-vous pensé des visuels de cette newsletter ?
- Descript : l’outil qu’on utilise pour condenser 4-8 heures de rush sur 5 caméras et 3 micros différents en une vidéo digeste de 20 minutes.
- Fireflies : délègue la prise de notes ce qui nous permet d’être entièrement présents en appel. Il y a énormément d’outils équivalents sur le marché, on en a testé une dizaine et c’est celui qu’on a préféré.
Devenir partenaire
Un message que vous souhaiteriez partager à la communauté ? Soumettez-nous votre projet en cliquant sur ce lien.
C’est tout pour cette édition de Noël. J’espère sincèrement que vous n’êtes pas en train de lire une newsletter d’IA en ce jour, mais si c’est le cas, joyeux noël.
Quoi qu’il en soit je vous retrouve bientôt pour l’édition spéciale fin d’année. Comme d’habitude, si ce moment vous a plu, ou non, faites-le nous savoir. Nous lisons et répondons à tous les mails. Nous accordons beaucoup de valeur à ce que vous avez à nous dire.
C’était Rayan Dilavar, pour IA Mania
|