Actualité de l’IA
Juillet en bref 🚀
A l’avenir, les IA devraient accomplir de plus en plus de tâches en autonomie totale, en manipulant elles-mêmes les outils dont elles ont besoin pour les accomplir et en intervenant directement sur nos fichiers. En juillet, OpenAI fait entrer les utilisateurs payants de ChatGPT dans cette nouvelle ère dite « agentique » en intégrant ChatGPT Agent à son interface.
xAI se devait de ne pas être distancé par les modèles « Pro » sortis ces derniers mois chez Google, OpenAI et Anthropic. C’est chose faite avec Grok 4 qui tient ses promesses dans les benchmarks et devient un concurrent de taille.
Ces modèles « Pro » aux capacités époustouflantes demeurent coûteux, avec des abonnements aux plateformes se situant entre 200 et 300 € par mois sur chaque plateforme. Perplexity a donc imaginé une l’offre Perplexity Max pour les réunir tous…
Côté vidéo, les projecteurs sont braqués sur Runway avec la sortie d’Act 2, son nouveau modèle de capture de mouvements, qui permet de calquer les gestes et paroles d’un personnage fictif sur les performances d’un acteur réel à partir d’une vidéo, sans équipement de motion capture.
🔍 Lexique
Frontier models
(modèles « de frontière« )
Ce sont les modèles d’IA les plus avancés techniquement disponibles à un instant donné.
On parle de frontier AI pour désigner des modèles de pointe, proches des limites actuelles de la recherche.
Cela inclut par exemple GPT-4o, Claude 3 Opus, Gemini 1.5 Pro, ou encore Qwen 3 pour Alibaba.
Ces modèles sont généralement multimodaux, très bons en raisonnement, et capables de traiter de grandes fenêtres de contexte.
⏳ Dans l’actualité IA bientôt…
GPT-5 toujours en approche…
Bien sûr, on attend toujours avec impatience ChatGPT5, avant la fin de l’été nous dit-on…
Mais OpenAI a également commencé à communiquer fin juillet sur Sora 2, une version améliorée du générateur de vidéo qui intégrera à son tour la génération de sons et d’ambiances audio synchronisées avec les vidéos…
Veo3 aura donc bientôt un concurrent de taille.
🤖 Côté bots conversationnels
OpenAI
Le lancement majeur de ChatGPT Agent a eu lieu le 17 juillet, permettant au chatbot de contrôler son propre ordinateur virtuel. OpenAI fusionne les capacités d’Operator et Deep Research pour aller au-delà : proposer un agent qui peut effectuer des tâches complexes en utilisant son propre navigateur, son propre terminal et interagir avec vos services web via la fonction Connectors.
Il est dès à présent disponible pour les abonnés Plus et Pro avec 40 requêtes/mois.
xAI
Grok 4, le dernier modèle de xAI, est sorti officiellement le 9 juillet 2025 en accès standard à 30 $/mois. Ce modèle marque une évolution significative pour xAI : il intègre un système « multi-agent » pour générer des réponses plus pertinentes et ses capacités multimodales (analyse texte, images et vidéos) sont annoncées d’ici la fin de l’été.
Grok 4 surpasse ses concurrents sur plusieurs benchmarks et introduit plusieurs nouveautés marquantes : voix naturelles, meilleure compréhension du code, et accès direct à des données web.
Une version plus performante, Grok 4 Heavy, est également disponible via un abonnement premium à 300 $/mois, tandis que l’accès standard coûte 30 $/mois.
Perplexity
Une seule offre pour les réunir tous… L’agrégateur de modèles Perplexity lance Perplexity Max, une offre premium à 200$/mois avec accès illimité aux Labs (son outil pour générer rapports, tableaux, présentations ou applications web), au navigateur intelligent et expérimental « Comet », ainsi que l’accès aux « frontier models » des différentes plateformes concurrentes (ainsi qu’à tout nouveau modèle en avant-première) : OpenAI o3‑Pro, Anthropic Claude Opus 4, Google Gemini 2.5 Pro et Alibaba Qwen 3.
🎨 Coté génération d’images & vidéo
Runway ML
Runway ML inaugure Act-Two, un modèle de transfert de mouvement à partir d’une vidéo de performance d’un comédien et d’une image (ou d’une vidéo) de référence. Le modèle permet d’animer des personnages humains comme des personnages non-humains. On peut ainsi générer jusqu’à 30 secondes de vidéo en 720P pour un coût de 5 crédits par seconde (et une génération illimitée en Explore Mode pour les plans « Unlimited »- 95 $ / mois).
Un modèle de motion capture sans concurrence à ce jour, particulièrement intuitif : un simple smartphone suffit, aucun équipement spécialisé n’est requis. Malheureusement Act-Two ne génère pas encore de bande sonore, il ne lui manque que la parole…
Midjourney
En juillet, Midjourney a amélioré ses fonctionnalités vidéo : vous pouvez désormais définir une image de début et une image de fin, une fonction idéale pour coller à un storyboard précis. Une fonction « loop » est également implémentée pour des contenus en boucle. L’ensemble est disponible sur la plate-forme en ligne et via Discord.
💡 Pratique
Où utiliser Veo3 ?
Pour rappel, Veo3 est pour l’instant le seul outil IAG générant des vidéos avec audio immersif et/ou dialogue synchronisé. La plateforme de Google Flow n’étant pas encore accessible en France, voici les options actuellement disponibles pour utiliser Veo3 sans VPN :
- Google Gemini : avec un abonnement Google AI Pro (21.99 € mensuel, premier mois offert), vous pourrez créer 3 vidéos par jour de 8 secondes (720p). Et bien sûr l’abonnement AI Ultra (139.99 € mensuel) permet un accès illimité. 👉 Accès à Gemini.
- Canva : la génération de vidéo via Veo3 est disponible dans votre abonnement Pro (12 € mensuel), Team ou Entreprise, via une nouvelle fonctionnalité « Créer un clip vidéo ». Vous pourrez pour l’instant créer 5 vidéos par mois de 8 secondes. 👉 Accès à Canva
- Firefly : depuis le 17 juillet, avec un abonnement standard (11.08 € mensuel) ou Pro (33.26 €), vous pourrez utiliser Veo3 mais également d’autres modèles IA (Gen-4 Runway, Ray2 Luma AI). 👉 Accès à Firefly
📰 On en parle…
Nouvelles embauches IA chez meta : Mark Zuckerberg, le PDG de Meta, débauche massivement 11 experts IA d’OpenAI, Anthropic et Google DeepMind qui travailleront au sein des Meta Superintelligence Labs (MSL) pour tenter de gagner la course à l’AGI (Intelligence Artificielle Générale).
🔎 En savoir plus : Cet article de BFMTV propose une synthèse claire des recrutements massifs orchestrés par Meta et des défis éthiques et stratégiques associés.