Actualité de l'intelligence artificielle générative - février 2025

Actualité de l’IA

Mai en bref 🚀

Google a fait grand bruit ce mois-ci, puisqu’il a tiré à profit sa grande conférence annuelle (Le Google I/O) pour présenter ses dernières innovations en matière d’IA : un LLM ultra-performant en codage (Gemini 2.5 Pro), un modèle de génération d’images ayant enfin résolu les problèmes habituels de typographie (Imagen 4) et un générateur qui révolutionne la vidéo IA par sa capacité à générer bande son et dialogues à partir de votre prompt (Veo 3).

La concurrence ne se laisse toutefois pas distancer, avec des modèles à raisonnement avancé qui rivalisent dans les benchmarks : Grok 3.5 et Opus 4 pour xAI et Anthropic pendant qu’OpenAI tente de séduire les développeurs avec ChatGPT 4.1.

Le dernier modèle hybride Qwen d’Alibaba passerait presque inaperçu, et c’est dommage… parce qu’il est performant et gratuit. Mais attention toutefois à la censure et à la confidentialité des données.

🔍 Affaire à suivre…

Model Welfare :
vers le bien-être des IA…

En mai 2025, Anthropic a annoncé un nouveau programme expérimental baptisé Model Welfare. Il s’agit d’un cadre éthique prospectif qui dépasse la simple problématique de l’alignement des modèles d’IA avec les valeurs humaines. Il s’agit d’explorer l’hypothèse d’une émergence de conscience ou de sensibilité chez les IA.

Le programme étudie les signes possibles de « souffrance » ou de préférences chez les IA et envisage des interventions simples si cela s’avère pertinent — tout en reconnaissant qu’il n’existe aujourd’hui aucune preuve scientifique d’une conscience artificielle.

👉 Pour en savoir plus, consultez la page officielle d’Anthropic : Exploring model welfare

     

    🤖 Côté bots conversationnels

    Google

    Une foison de sorties chez Google à l’occasion du Google I/O 2025

    • Gemini 2.5 Pro intègre le mode « Deep Think » pour un raisonnement approfondi, leader sur les benchmarks en mathématique et en codage. Il nécessite toutefois un abonnement AI Ultra (250 $ / mois). 👉 Accès à Gemini.
    • Imagen 4, un modèle de génération d’images 2K améliorée, avec meilleure gestion du texte, est intégré dans l’app Gemini.
    • NotebookLM accède à une mise à jour majeure avec un aperçu audio dans 50 langues en s’appuyant sur Gemini 2.5, capable d’analyser jusqu’à 300 sources (documents, sites web, audios et vidéos). La fonction Podcast est donc désormais accessible en français, ainsi que la fonction mind-map (mais il faut penser à spécifier Français comme langue de sortie dans les paramètres). 👉 Accès à Notebookml
    • Gemini est intégré dans Chrome (uniquement aux USA pour l’instant) avec une extension permettant de résumer ou traduire instantanément les pages web.
    • Google rend également disponible gratuitement Jules, son modèle asynchrone dédié au code, (jules.google.com).

    xAI

    Entrée en beta publique de Grok 3.5, un modèle avec un contexte d’un million de tokens et un mode « Think » pour le raisonnement étape par étape. xAI annonce également un partenariat avec Microsoft pour l’intégration sur Azure AI Foundry. 👉 Accès à Grok

    Alibaba

    Alibaba inaugure la famille de son nouveau modèle gratuit Qwen 3 (8 modèles, jusqu’à 235 milliards de paramètres pour le modèle le plus performant et une API peu onéreuse). Un modèle hybride (il permet de commuter entre le mode réflexion et un mode non-réflexion plus efficace en dialogue) avec une prise en charge d’une centaine de langues. Il est déjà dans le top cinq de la plupart des benchmarks dès sa sortie. Attention cependant à la censure des informations d’actualité sur les modèles chinois. 👉 Accès à Qwen

    OpenAI

    OpenAI renforce sa position sur la génération de code. Le modèle ChatGPT 4.1 (et sa version mini), qui affiche des capacités de code avancées et jusqu’ici accessible via l’API est désormais intégré à ChatGPT. 👉 Accès à ChatGPT

    OpenAI lance également Codex2, un Agent IA optimisé pour les développeurs, capable d’automatiser le code, corriger des bugs, exécuter des tests et maintenir du code, sans intervention humaine, un délai de réponse de quelques minutes. Accessible depuis le ChatGPT pour abonnés payants.

    Anthropic

    • Opus 4, un nouveau modèle premium pour code et raisonnement vient enrichir les modèles d’Anthropic. Accessible aux plans Pro, Max, Team et Enterprise via API ou plateformes cloud (Vertex AI / Amazon Bedrock).
    • Sonnet 4 est sa version gratuite pour les usages courants, bénéficiant d’un bon équilibre performance/prix. 👉 Accès à Claude

    Meta

    Meta AI App est le nouvel assistant conversationnel autonome de meta, disponible dès fin avril sur smartphones et doté du modèle Llama 4. Après activation dans les messageries Meta, il permet des requêtes vocales, la mémorisation de contexte et l’exploitation des lunettes Ray-Ban Meta AI pour traduction, reconnaissance visuelle et interaction contextuelle.

    Par ailleurs, Meta AI envahit Facebook, Instagram, Threads et WhatsApp, sous la forme d’un petit cercle coloré qui s’affiche en haut ou en bas des conversations. Il s’agit d’un bot conversationnel, il n’a pas accès aux données des conversations. Il peut toutefois être mentionné dans une conversation afin de générer un contenu. Pour l’instant il ne peut être désactivé.

    Perplexity

    Perplexity se dote de nouvelles fonctionnalités : améliorations des capacités de recherche, intégration WhatsApp, recherche conversationnelle et analyse de document. 👉 Accès à Perplexity

    🎨 Coté génération d’images & vidéo 

    Google

    • Sortie de Imagen 4 (génération d’images 2K avec un meilleur rendu typographique).
    • L’abonnement AI Ultra permet d’expérimenter Flow, la plate-forme de Google équipée de Veo3, premier générateur vidéo à générer une bande sonore composée de bruitages et de dialogues. En avril, Flow n’est malheureusement pas encore disponible en France.

    Adobe

    Firefly se dote du nouveau Image Model 4, d’une résolution 2K. C’est désormais aussi le modèle intégré à Premiere Pro pour les extensions génératives. 👉 Visiter Firefly