Créer un logo percutant pour sa marque avec Imagen 3 et Gemini
Layolin Jesudhass
Customer Engineer - Data & Analytics, Google
Essayer GCP
Les nouveaux clients peuvent explorer et évaluer Google Cloud avec des conditions exceptionnelles.
EssayerL'an dernier, nous avons annoncé Imagen 3, notre modèle de génération d'images le plus performant à ce jour. Imagen 3 est notamment accessible aux clients de Vertex AI, permettant ainsi aux entreprises de créer des images de haute qualité qui reflètent leur identité visuelle et leurs logos, que ce soit pour le marketing, la publicité ou le design produit.
Aujourd'hui, nous allons vous montrer comment développer l'identité visuelle de votre marque en créant un logo à l'aide d'Imagen 3, de Gemini et de la bibliothèque Python Pillow.
Commencez par générer des visuels avec Imagen 3
Imagen 3 est capable de créer des images extrêmement réalistes et de très haute qualité à partir de simples prompts (instructions textuelles), surpassant les versions précédentes d'Imagen en termes de gestion des détails, d'éclairage et d’artefacts (imperfections). La dernière évolution du modèle Imagen 3 (002) repousse encore les limites avec des rendus visuels plus séduisants, une interprétation plus précise des consignes et des rendus visuels globalement supérieurs.
En pratique, voici comment fonctionne notre exemple : Imagen 3 génère les images initiales, Gemini sélectionne les plus pertinentes et les affine, tandis que Pillow (une bibliothèque de traitement d’images en Python) permet de la manipuler de façon précise et de l’intégrer à vos workflows. En combinant ces outils, vous pouvez développer votre identité de marque de manière à la fois personnalisée, optimisée et automatisée.
Imagen 3 s’appuie sur une interrogation en langage naturel (NLP) et transforme les instructions textuelles en images de haute qualité. Mais le véritable secret d’une image parfaite réside dans le couplage d'Imagen avec le processus de sélection de Gemini.
Voici comment s’enchaînent les modèles pour optimiser la création et la sélection du meilleur visuel :


Prenons un exemple concret pour illustrer la démarche : imaginons que vous ouvriez un café nommé « Layo Cafe ». Vous souhaitez créer un visuel qui incarne l'esthétique moderne et accueillante de votre marque.
Voici comment combiner Imagen et Gemini :
- Décrivez votre vision de la marque en fournissant à Imagen une première description. Exemple de description : « Créer une image pour la campagne d'un nouveau café ». Gemini reformulera votre demande pour générer une description plus pertinente, comme : « Image photoréaliste d'un intérieur de café moderne et lumineux, mettant en scène une tasse de café fumante sur une table minimaliste, baignée dans une lumière naturelle et chaleureuse. L'accent est mis sur le café et l'ambiance accueillante ».
- Générez différentes options : Imagen va produire plusieurs propositions différentes à partir de la description fournie.
- Sélection par Gemini : Gemini, le LLM multimodal de nouvelle génération de Google, analyse chaque image, prenant en compte des critères comme l'esthétique, la lisibilité et la cohérence avec l'identité de marque pour ensuite sélectionner l'option la plus appropriée.
Dans cet exemple, Gemini a généré 4 images :


Lorsqu'on demande à Gemini quelle image répond mieux aux objectifs, il répond la première. Pourquoi ? Selon les critères définis, elle offre le meilleur équilibre : on y voit une tasse de café avec un latte art fumant, dans un cadre moderne et lumineux, baigné de la lumière naturelle et chaleureuse qui filtre à travers de grandes fenêtres. L'arrière-plan délicatement flouté maintient l'attention sur le café. L'esthétique générale est accueillante et séduisante, susceptible d'attirer la clientèle. Dans les autres images, il manque soit le latte fumant (essentiel pour mettre en valeur les créations du café), soit la lumière chaleureuse et accueillante.
Vous pouvez ajuster ou compléter les instructions données à Gemini en fonction du résultat escompté afin de sélectionner la meilleure image en fonction de vos attentes et du cas d’usage spécifique.


Passez à l’étape de l’intégration de votre logo
Maintenant que vous possédez une image adaptée, il est temps de l'intégrer à vos supports marketing. Pour concrétiser cette étape, nous allons combiner nos deux modèles IA Gemini et Imagen avec la bibliothèque Pillow.
Voici, visuellement, comment s’enchaînent les étapes et l’utilisation des outils :


Reprenons maintenant les étapes précédentes et ajoutons-y les intégrations évoquées :
- Plantez le décor : fournissez à Imagen une description de l'image souhaitée, par exemple, « Créer une image pour la campagne d'un nouveau café ». Gemini reformulera votre demande pour générer un prompt plus efficace, comme : « Image photoréaliste d'un intérieur de café moderne et lumineux, présentant une tasse de café fumante sur une table minimaliste, baignée dans une lumière naturelle et chaleureuse. L'accent est mis sur le café et l'ambiance accueillante ».
- Demandez à Gemini de sélectionner la meilleure image en fonction des objectifs de votre marque : Gemini analyse les images générées et sélectionne celle qui représente le mieux votre marque tout en respectant l'esthétique recherchée.
- Répétez le processus (étape 1 et 2) pour créer un nouveau logo ou, si vous en avez déjà un, passez à l'étape suivante.
- Intégrez avec Pillow : la bibliothèque Pillow permet d'ajouter votre logo Layo Cafe à l'image préalablement sélectionnée. Gemini est d’abord interrogé afin d’optimiser automatiquement le placement et la taille du logo pour un impact visuel maximal. Les informations fournies par Gemini sont ensuite récupérées pour intégrer le logo dans l’image préalablement sélectionnée à travers quelques lignes de code Python très simples et l’utilisation de la bibliothèque Pillow.
Dans ce cas, voici la meilleure option de logo retenue :


Et pour finir, captez l'attention avec un message
Enrichissez vos visuels en y intégrant un message. L’ajout d’une accroche mémorable ou d’une promotion attractive, intégrée à vos images générées par IA, est toujours un moyen efficace pour mieux capter votre audience.
- Rédigez votre message : choisissez le texte à ajouter à votre image. Par exemple, « Layo Café : Votre dose quotidienne d'inspiration ».
- Appliquez le texte sur l’image avec Pillow : cette bibliothèque de traitement d'images Python agit comme un pinceau d'artiste, intégrant le texte à l'image selon les recommandations de Gemini (qui à travers un prompt peut indiquer à Pillow où et comment placer au mieux l’accroche textuelle). Avec Pillow, le texte s’intègre de manière naturelle, permettant d'obtenir un résultat final très soigné.
- Ciblez des audiences partout dans le monde : l’un des grands avantages de ce processus de pouvoir ajouter du texte dans n'importe quelle langue sur vos images. Il suffit de demander à Gemini de traduire le texte d’origine dans les différentes langues ciblées. Cette prise en charge multilingue élargit vos horizons créatifs : vous pouvez adresser différents publics à l’international avec des messages adaptés.
Assemblons les différents éléments du projet. Voici le logo et le texte, intégrés à la meilleure image générée par Imagen.


Passez à l'action dès aujourd'hui !
En combinant les capacités créatives d'Imagen avec les fonctionnalités intelligentes de sélection et de design de Gemini, vous pouvez créer un logo, développer des supports marketing personnalisés et enrichir votre storytelling visuel. Si vous souhaitez consulter le code de notre projet et obtenir davantage d’exemples, vous pouvez les retrouver sur GitHub.