Générez des images à partir de descriptions textuelles en quelques secondes à l'aide de la génération d'images optimisée par l'IA de Google Cloud avec les API disponibles dans les langages de programmation Python, Java et Go.
Les nouveaux clients bénéficient d'un maximum de 300 $ de crédits pour générer des images et plus encore à l'aide d'Imagen sur Vertex AI.
Présentation
L'IA texte-vers-image est un type d'intelligence artificielle capable de générer des images à partir de descriptions textuelles. Cette technologie a le potentiel de transformer la façon dont nous interagissons avec les contenus visuels et en créons des contenus. Les outils et ressources Google Cloud Text-to-AI, y compris des modèles d'IA pré-entraînés comme Imagen, Parti et Muse, disponibles dans Vertex AI, sont conçus pour aider les développeurs à implémenter facilement la génération de texte en image dans leurs applications. Et avec AutoML, vous pouvez personnaliser des modèles d'IA pour des applications propres à un domaine.
L'IA texte-vers-image peut être utilisée dans le développement d'applications pour générer des maquettes, des prototypes, des illustrations, des données de test, des contenus éducatifs et des visualisations à des fins de débogage. Vertex AI et l'API Cloud Vision de Google Cloud permettent aux développeurs d'accéder à une suite de fonctionnalités de traitement d'images, y compris la détection de texte, la détection d'objets et la classification d'images.Document AI peut être utilisé pour extraire du texte à partir de documents scannés afin de générer des images de description textuelle.
Imagen, Parti et Muse sont des modèles texte-vers-image clés. Imagen est un modèle de diffusion au haut degré de photoréalisme. Parti (modèle texte-vers-image autorégressif de Pathways) est compatible avec la synthèse de contenus riches en contenus, basée sur des compositions complexes et sur une connaissance du monde réel. Muse est un modèle Transformer offrant de solides performances de génération d'images. Gemini étend les possibilités offertes par un modèle capable de comprendre quasiment n'importe quelle entrée et de générer presque toutes les sorties, y compris du texte, des images, de l'audio, de la vidéo et du code.
Le modèle de diffusion Imagen est idéal pour le photoréalisme avec une compréhension approfondie du langage. Parti, un modèle autorégressif, est idéal pour appliquer un style et un thème cohérents, et pour générer des images dans un style particulier. Muse, un modèle Transformer, peut générer des images contenant plusieurs objets et une composition complexe. Chacun offre des avantages uniques : Imagen excelle en matière de photoréalisme, Parti en contenu enrichi et Muse en termes de vitesse et d'outils de retouche. Tous sont faciles à utiliser et ne nécessitent aucune connaissance en programmation.
Imagen 3 est le dernier modèle de génération d'images de Google. Il offre une qualité d'image exceptionnelle et plusieurs améliorations par rapport à Imagen 2 : génération plus de 40 % plus rapide pour un prototypage et une itération rapides, meilleure compréhension et meilleur suivi des requêtes, générations photoréalistes, notamment des groupes de personnes et contrôle accru sur le rendu du texte dans une image.
Lancement en version preview pour les clients Vertex AI disposant d'un accès anticipé. Imagen 3 est également compatible avec plusieurs langages, et comprend des fonctionnalités de sécurité intégrées comme le filigrane numérique SynthID de Google DeepMind et la compatibilité avec plusieurs formats.
Vous pouvez accéder à ces modèles d'IA texte-vers-image via Vertex AI sur Google Cloud ou via un fournisseur d'API tiers.Pour utiliser les modèles, il vous suffit de fournir une requête textuelle, de sélectionner des paramètres (certains modèles vous permettent de choisir des paramètres qui contrôlent le style, la créativité et la précision de l'image générée), puis de générer l'image.
Fonctionnement
L'IA texte-vers-image utilise le traitement du langage naturel (TLN) pour convertir la description textuelle dans un format lisible par un ordinateur. Une fois converti dans un format lisible par l'ordinateur, le modèle de machine learning est entraîné sur un vaste ensemble de données de textes et d'images, puis apprend à identifier des modèles et les utilise pour générer de nouvelles images. L'IA texte-vers-image de Google Cloud s'appuie sur un modèle de deep learning appelé Imagen, un modèle de pointe qui peut générer des images photoréalistes à partir de descriptions textuelles.
Utilisations courantes
Découvrez comment utiliser la fonctionnalité de génération de texte-vers-image d'Imagen sur Vertex AI et exporter une version améliorée d'une image générative. Ce guide de démarrage rapide vous explique comment utiliser la génération d'images Imagen dans la console Google Cloud.
Découvrez comment utiliser la fonctionnalité de génération de texte-vers-image d'Imagen sur Vertex AI et exporter une version améliorée d'une image générative. Ce guide de démarrage rapide vous explique comment utiliser la génération d'images Imagen dans la console Google Cloud.
Utilisez Imagen pour modifier des images générées ou existantes. Vous pouvez utiliser une invite de texte pour mettre à jour l'image entière (modification sans masque) ou spécifier une partie de l'image à modifier en plus de la description textuelle des mises à jour (modification basée sur des masques).
Utilisez Imagen pour modifier des images générées ou existantes. Vous pouvez utiliser une invite de texte pour mettre à jour l'image entière (modification sans masque) ou spécifier une partie de l'image à modifier en plus de la description textuelle des mises à jour (modification basée sur des masques).