Actualité de l'intelligence artificielle générative - février 2025

Actualité de l’IA

Septembre en bref 🚀

Entre personnalisation, apprentissage et créativité, septembre confirme la tendance : les intelligences artificielles deviennent plus humaines, plus pédagogiques et plus ancrées dans nos usages quotidiens.

Je note que l’effort est mis particulièrement sur l’augmentation de la mémoire des interactions, le lien personnalisé à l’utilisateur et les connections aux applications externes via les MCP pour rendre les IA plus « agentiques » et indispensables…

 

🔍 Lexique

Les MCP

Les MCP (Model Context Protocol) sont une norme émergente permettant aux modèles d’IA d’interagir directement avec des outils ou services externes.

Plutôt que de se limiter à une conversation isolée, un modèle connecté via MCP peut, par exemple, consulter un document, créer une tâche dans un logiciel de gestion de projet ou extraire des données d’une base en ligne.

Cette approche, adoptée progressivement par OpenAI, Anthropic, Google et Mistral, vise à rendre les IA interopérables et actionnables — capables d’agir concrètement dans nos environnements numériques.

    ⏳ Dans l’actualité IA bientôt…

    OpenAI testerait déjà un mode Mémoire Universelle, capable de synchroniser l’historique d’un utilisateur sur plusieurs appareils.
    Runway Gen‑3 Turbo pourrait arriver en version publique dès octobre, avec une meilleure cohérence de mouvement.
    Meta plancherait sur un générateur de voix multilingue temps réel pour Messenger.
    Google préparerait une mise à jour Gemini 3, axée sur la génération d’images haute fidélité et la création vidéo collaborative.

     

    🤖 Côté bots conversationnels

    OpenAI

    ChatGPT se dote d’un nouvel espace de personnalisation regroupant mémoire, préférences et réglages de base. On peut désormais choisir une personnalité prédéfiniecynique, robot, attentif ou passionné — à combiner avec ses instructions personnalisées.

    En fin de mois, OpenAI annonce aussi une fonction de contrôle parental : les parents peuvent associer un compte enfant, fixer des horaires d’utilisation, désactiver le mode vocal ou filtrer les contenus sensibles. En cas de danger présumé, une équipe dédiée est alertée.

    Autre nouveauté : Pulse, pour les abonnés Pro, qui affiche chaque matin 5 à 10 cartes personnalisées d’actualités ou de ressources selon vos centres d’intérêt et vos conversations récentes.

     👉Présentation de Pulse par OpenAI


    Google

    Gemini peut désormais analyser, résumer et transcrire des fichiers audio (MP3, M4A, WAV, etc.) de plus de 10 minutes — gratuitement jusqu’à 5 prompts par jour. Les membres Pro et AI Ultra disposent de 3 heures d’audio et de 10 uploads simultanés.
    Côté apprentissage, Notebook LM introduit le mode Learning Guide, un tuteur numérique capable de créer des quiz interactifs, des fiches de révision et des rapports dynamiques à partir de vos sources.

    👉 Article de Softline sur la transcription audio de Gemini

    👉 Présentation du Learning Guide (Google Workspaces)


    Anthropic

    Claude Sonnet 4.5 arrive, présenté comme le meilleur modèle de codage actuel. Il s’intègre à VS Code, crée des fichiers, utilise un navigateur et introduit des checkpoints pour revenir à une étape antérieure.
    Claude ajoute aussi des fonctions bureautiques : génération de PDF, de présentations et de tableaux Excel. Les comptes payants bénéficient d’une mémoire étendue et sélective, activable dans les préférences, et d’un mode incognito pour les sessions temporaires.

    👉 Les nouveautés de Claude 4.5 (ITSocial)


    Mistral

    Le Chat inaugure sa fonction « Souvenirs  », une mémoire persistante permettant de retrouver le contexte de vos échanges précédents. Chaque élément peut être ajouté, modifié ou supprimé — et il est même possible d’importer la mémoire de ChatGPT. Le Chat s’enrichit aussi de connecteurs MCP vers une vingtaine d’applications professionnelles, renforçant son intégration dans les workflows métiers.

    👉 Présentation de Memories (version Beta) par Mistral

    👉 Présentation des connecteurs MCP par Mistral

    🎨 Coté génération d’images & vidéo 

    OpenAI

    OpenAI frappe fort avec Sora 2, une évolution de son modèle vidéo capable de générer des bandes sonores complètes (dialogues, effets, ambiances).
    Elle va être déployée progressivement et n’est disponible pour l’instant que sur le site ou IOS aux USA et au Canada.
    Les nouveaux
    « cameos » permettent d’intégrer un personnage réel ou fictif dans une scène générée, tout en respectant sa voix, son apparence et ses mouvements.
    L’entreprise expérimente aussi un réseau social façon TikTok, intégré à l’appli., dédié au partage de vidéos IA. Il est actuellement réservé aux États‑Unis et au Canada.

    👉 Présentation de Sora2 par OpenAI


    Canva

    L’IA conversationnelle de Canva, lancée au printemps, s’étend désormais à une application mobile mondiale disponible en français. Elle permet de dialoguer pour concevoir des visuels directement éditables dans Canva.

    👉 Lien Canva pour Android


    Luma

    Luma AI dévoile Ray 3, son modèle d’imagerie 3D désormais intégré à Adobe Firefly. Ce partenariat renforce les capacités d’Adobe en matière de rendu photoréaliste et de création de scènes complexes.

    il cible la génération 3D photoréaliste en HDR, la gestion de la lumière en temps réel et les scènes dynamiques, se rapprochant davantage des workflows VFX / réalité mixte que des générateurs vidéo classiques comme Sora ou Veo.

    👉 Présentation de Ray3 par Adobe Firefly