Générez et modifiez des images à partir de descriptions textuelles en quelques secondes à l'aide des modèles de génération d'images Gemini 3 Pro Image et Imagen avec les API disponibles dans les langages de programmation Python, Java et Go.
Les nouveaux clients peuvent obtenir jusqu'à 300 $ de crédits inclus pour générer des images et plus sur Gemini Enterprise Agent Platform.
Présentation
L'IA texte en image est un type d'intelligence artificielle capable de générer et de modifier des images à partir de descriptions textuelles. Cette technologie a le potentiel de transformer la façon dont nous interagissons avec les contenus visuels et en créons des contenus. Les outils et ressources Google Cloud Text-to-AI, y compris des modèles d'IA pré-entraînés comme Imagen, Gemini 3 Pro Image et Veo, disponibles dans Agent Platform, sont conçus pour aider les développeurs à implémenter facilement la génération de texte en image dans leurs applications.
L'IA texte-vers-image peut être utilisée dans le développement d'applications pour générer des maquettes, des prototypes, des illustrations, des données de test, des contenus éducatifs et des visualisations à des fins de débogage. Agent Platform et l'API Cloud Vision de Google Cloud permettent aux développeurs d'accéder à une suite de fonctionnalités de traitement d'images, y compris la détection de texte, la détection d'objets et la classification d'images.Document AI peut être utilisé pour extraire du texte à partir de documents scannés afin de générer des images de description textuelle.
Vous pouvez accéder à ces modèles d'IA texte en image via Agent Platform sur Google Cloud ou Google AI Studio.Pour utiliser les modèles, il vous suffit de fournir un prompt textuel, de sélectionner des paramètres (certains modèles vous permettent de choisir des paramètres qui contrôlent le style, la créativité et la précision de l'image générée), puis de générer l'image.
Fonctionnement
L'IA texte en image utilise le traitement du langage naturel (TLN) pour convertir la description textuelle dans un format lisible par machine. Une fois converti dans un format lisible par machine, le modèle de machine learning est entraîné sur un vaste ensemble de données de textes et d'images, puis apprend à identifier des modèles et les utilise pour générer ou modifier des images.
Découvrez comment utiliser la fonctionnalité de génération de texte en image d'Imagen sur Agent Platform et exporter une version améliorée d'une image générative. Ce guide de démarrage rapide vous explique comment utiliser la génération d'images Imagen dans la console Google Cloud.
Découvrez comment utiliser la fonctionnalité de génération de texte en image d'Imagen sur Agent Platform et exporter une version améliorée d'une image générative. Ce guide de démarrage rapide vous explique comment utiliser la génération d'images Imagen dans la console Google Cloud.
Avec Gemini, vous pouvez combiner différentes images en une seule et nouvelle image. Utilisez plusieurs images de référence pour créer une seule image unifiée. Vous pouvez aussi modifier des images à l'aide d'instructions simples en langage naturel. Que vous souhaitiez supprimer une personne d'une photo de groupe ou corriger un petit détail comme une tache, vous pouvez apporter des modifications en discutant simplement avec l'IA.
De plus, Imagen sur Agent Platform vous permet de modifier des images générées par Imagen ou des images existantes. Vous pouvez spécifier la partie de l'image à modifier et une description textuelle des modifications à apporter (modification basée sur des masques).
Avec Gemini, vous pouvez combiner différentes images en une seule et nouvelle image. Utilisez plusieurs images de référence pour créer une seule image unifiée. Vous pouvez aussi modifier des images à l'aide d'instructions simples en langage naturel. Que vous souhaitiez supprimer une personne d'une photo de groupe ou corriger un petit détail comme une tache, vous pouvez apporter des modifications en discutant simplement avec l'IA.
De plus, Imagen sur Agent Platform vous permet de modifier des images générées par Imagen ou des images existantes. Vous pouvez spécifier la partie de l'image à modifier et une description textuelle des modifications à apporter (modification basée sur des masques).
Générez des descriptions pertinentes pour vos images, y compris des métadonnées détaillées, des sous-titres automatiques, et une description rapide des produits et des composants visuels.
Générez des descriptions pertinentes pour vos images, y compris des métadonnées détaillées, des sous-titres automatiques, et une description rapide des produits et des composants visuels.