Cette page a été traduite par l'API Cloud Translation.

Obtenir des embeddings de texte

Ce document explique comment créer un embedding de texte à l'aide de l'API Text embeddings de Vertex AI.

L'API Vertex AI Text Embeddings utilise des représentations vectorielles denses : gemini-embedding-001, par exemple, utilise des vecteurs de 3 072 dimensions. Les modèles d'embedding vectoriels (ou "plongement vectoriel") denses utilisent des méthodes de deep learning semblables à celles utilisées par les grands modèles de langage. Contrairement aux vecteurs creux, qui ont tendance à mapper directement les mots à des nombres, les vecteurs denses sont conçus pour mieux représenter le sens d'un extrait de texte. L'utilisation d'embeddings vectoriels denses dans l'IA générative fait qu'au lieu de rechercher des correspondances directes de mots ou de syntaxe, vous pouvez mieux rechercher des passages correspondant au sens de la requête, même si les passages n'utilisent pas la même langue.

Les vecteurs sont normalisés. Vous pouvez donc utiliser la similarité cosinus, le produit scalaire ou la distance euclidienne pour fournir les mêmes classements de similarité.

Pour en savoir plus sur les embeddings, consultez la présentation des API d'embeddings.
Pour en savoir plus sur les modèles d'embeddings textuels, consultez Embeddings de texte.
Pour en savoir plus sur les langues compatibles avec chaque modèle d'embedding, consultez Langues de texte compatibles.

Avant de commencer

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

Choisissez un type de tâche pour votre job d'embeddings.

Modèles compatibles

Modèles Google

Vous pouvez obtenir des embeddings textuels à l'aide des modèles suivants :

Nom du modèle	Description	Dimensions de sortie	Longueur maximale de la séquence	Langues de texte compatibles
`gemini-embedding-001`	Performances de pointe pour les tâches en anglais, multilingues et de code. Il unifie les modèles spécialisés précédents, tels que `text-embedding-005` et `text-multilingual-embedding-002`, et offre de meilleures performances dans leurs domaines respectifs. Pour en savoir plus, consultez notre rapport technique.	Jusqu'à 3 072	2 048 jetons	Langues de texte disponibles
`text-embedding-005`	Spécialisé dans les tâches en anglais et de code.	Jusqu'à 768	2 048 jetons	Anglais
`text-multilingual-embedding-002`	Spécialisé dans les tâches multilingues.	Jusqu'à 768	2 048 jetons	Langues de texte disponibles

Pour une qualité d'embedding supérieure, gemini-embedding-001 est notre grand modèle conçu pour offrir les meilleures performances.

Modèles ouverts

Vous pouvez obtenir des embeddings textuels à l'aide des modèles suivants :

Nom du modèle	Description	Dimensions de sortie	Longueur maximale de la séquence	Langues de texte compatibles
`multilingual-e5-small`	Fait partie de la famille E5 de modèles d'embedding textuel. La petite variante contient 12 couches.	Jusqu'à 384	512 jetons	Langues disponibles
`multilingual-e5-large`	Fait partie de la famille E5 de modèles d'embedding textuel. La variante Large contient 24 couches.	Jusqu'à 1 024	512 jetons	Langues disponibles

Pour commencer, consultez la fiche du modèle de la famille E5. Pour en savoir plus sur les modèles ouverts, consultez Modèles ouverts pour MaaS.

Obtenir des embeddings textuels pour un extrait de texte

Vous pouvez obtenir des embedding textuels pour un extrait de texte à l'aide de l'API Vertex AI ou du SDK Vertex AI pour Python.

Limites d'API

Pour chaque requête, vous êtes limité à 250 textes d'entrée. L'API a une limite maximale de jetons d'entrée de 20 000. Les entrées qui dépassent cette limite entraînent une erreur 400. Chaque texte d'entrée individuel est également limité à 2 048 jetons. Tout excès est tronqué en mode silencieux. Vous pouvez également désactiver la troncature en mode silencieux en définissant autoTruncate sur false.

Pour en savoir plus, consultez Limites des embeddings de texte.

Choisir une dimension d'embedding

Par défaut, tous les modèles produisent un vecteur d'embedding complet. Pour gemini-embedding-001, ce vecteur comporte 3 072 dimensions, et les autres modèles produisent des vecteurs à 768 dimensions. Toutefois, en utilisant le paramètre output_dimensionality, les utilisateurs peuvent contrôler la taille du vecteur d'intégration de sortie. En sélectionnant une dimensionnalité de sortie plus petite, vous pouvez économiser de l'espace de stockage et augmenter l'efficacité de calcul pour les applications en aval, tout en sacrifiant peu en termes de qualité.

Les exemples suivants utilisent le modèle gemini-embedding-001.

Python

Installer

pip install --upgrade google-genai

Pour en savoir plus, lisez la documentation de référence du SDK.

Définissez les variables d'environnement pour utiliser le SDK Gen AI avec Vertex AI :

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai
from google.genai.types import EmbedContentConfig

client = genai.Client()
response = client.models.embed_content(
    model="gemini-embedding-001",
    contents=[
        "How do I get a driver's license/learner's permit?",
        "How long is my driver's license valid for?",
        "Driver's knowledge test study guide",
    ],
    config=EmbedContentConfig(
        task_type="RETRIEVAL_DOCUMENT",  # Optional
        output_dimensionality=3072,  # Optional
        title="Driver's License",  # Optional
    ),
)
print(response)
# Example response:
# embeddings=[ContentEmbedding(values=[-0.06302902102470398, 0.00928034819662571, 0.014716853387653828, -0.028747491538524628, ... ],
# statistics=ContentEmbeddingStatistics(truncated=False, token_count=13.0))]
# metadata=EmbedContentMetadata(billable_character_count=112)

Go

Découvrez comment installer ou mettre à jour le Go.