Jusqu’ici, il faut bien le dire, le générateur d’images d’OpenAI était loin de faire l’unanimité. Avec DALL-E, les visuels présentaient souvent des défauts visibles, des problèmes d’intégration du texte ou même des erreurs grossières sur les proportions. Face à Midjourney, Grok ou Imagen de Google, l’écart était flagrant. Mais ça, c’était avant.
OpenAI vient tout juste de déployer son tout nouveau générateur d’images basé sur GPT-4o, son modèle multimodal. Et autant le dire tout de suite : le changement est radical. Nous avons testé cet outil, et les résultats sont bien plus convaincants qu’auparavant.
Un outil plus précis et plus performant
Cette nouvelle génération d’images ne repose plus sur DALL-E, mais sur les capacités de GPT-4o. L’avantage ? Un modèle qui comprend mieux les consignes et qui gère beaucoup mieux le texte intégré aux images. Les pancartes illisibles, c’est fini. GPT-4o affiche désormais un rendu propre et lisible, y compris pour les logos, les affiches ou les infographies.

OpenAI met également en avant la possibilité d’enchaîner plusieurs demandes complexes dans une seule requête. Le modèle est capable de gérer jusqu’à 20 objets différents dans une image, tout en respectant leurs caractéristiques et les relations entre eux. Une prouesse qui ouvre la porte à des créations bien plus riches et détaillées.
L’édition d’images s’invite dans ChatGPT
Autre nouveauté intéressante : l’outil permet désormais de modifier des images existantes. Vous pouvez uploader une photo, demander des ajustements, ajouter des éléments ou même transformer entièrement la scène. Cette fonction ouvre de nouvelles possibilités, notamment pour la création de mèmes ou la réalisation de montages sur mesure.

Une intégration totale et un accès à tous
Ce nouveau générateur d’images devient la solution par défaut dans ChatGPT. Plus besoin de jongler entre différents outils ou d’activer DALL-E : tout se passe directement dans la conversation. Mieux encore, la fonctionnalité est disponible pour tout le monde, y compris dans la version gratuite de ChatGPT, avec quelques limitations sur le nombre d’images par jour.
Dans la version gratuite de ChatGPT, vous pouvez générer jusqu’à trois images par jour. Pour les abonnés aux offres Plus, Pro et Team, les quotas sont plus élevés, permettant une utilisation plus intensive de l’outil.
Petite précision : ce générateur d’images est aussi intégré à Sora, l’outil de génération vidéo d’OpenAI. Il pourra donc servir à illustrer des contenus vidéo avec la même qualité de rendu.

Des cas d’usage plus professionnels
OpenAI vise clairement un usage plus large avec GPT-4o. L’outil gère les visuels promotionnels, les infographies, les bande-dessinées et même les diagrammes. Il est également capable de produire des images avec fond transparent, parfait pour la création de logos ou de stickers.
Du côté de la sécurité, OpenAI précise que les images sont marquées avec des métadonnées C2PA afin d’identifier leur origine. Des filtres sont aussi en place pour empêcher la génération de contenus sensibles ou inappropriés.

Notre avis sur GPT-4o Image Generation
Après plusieurs tests, il faut bien l’admettre : GPT-4o change la donne. Les visuels sont plus propres, les détails bien mieux gérés et le texte parfaitement lisible. L’outil ne rivalise pas encore totalement avec Midjourney sur certains aspects artistiques, mais pour une utilisation générale, la qualité est là.
En intégrant la génération d’images directement dans ChatGPT, OpenAI réussit un joli coup et comble enfin son retard sur la concurrence. Une nouveauté qui devrait séduire autant les curieux que les professionnels en quête d’un outil polyvalent et facile d’accès.
Source : OpenAI