Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Vertex AI sur Google Distributed Cloud (GDC) air-gapped propose une liste croissante de modèles d'IA générative de base que vous pouvez tester, déployer et implémenter pour vos applications air-gapped. Les modèles de fondation sont adaptés à des cas d'utilisation spécifiques et proposés à des prix différents. Cette page récapitule les familles de modèles disponibles dans les API d'IA générative sur GDC et vous guide sur le choix des modèles par cas d'utilisation.
Modèles d'embeddings
Les embeddings convertissent les données textuelles écrites dans une langue naturelle en vecteurs numériques. Ces représentations vectorielles sont conçues pour capturer la signification sémantique et le contexte des mots qu'elles représentent. Les modèles d'embeddings de texte peuvent générer des embeddings optimisés pour différents types de tâches, tels que la récupération de documents, les questions-réponses, la classification et la vérification des faits. Pour le texte en anglais, utilisez text-embedding-004. Pour le texte multilingue, utilisez text-multilingual-embedding-002.
Le tableau suivant récapitule les modèles disponibles dans l'API Embeddings.
Pour en savoir plus sur les embeddings, consultez Embeddings de texte.
Modèle
Description
Spécifications
Embedding de texte
(text-embedding-004)
Renvoie des embeddings pour les entrées de texte en anglais.
Nombre maximal de jetons d'entrée : 2 048.
Dimensions d'embedding : moins de 768.
Représentations vectorielles continues pour le texte multilingue
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/09/04 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/09/04 (UTC)."],[],[],null,["# Available Generative AI models\n\n| **Important:** This content applies to version 1.14.4 and later.\n\nVertex AI on Google Distributed Cloud (GDC) air-gapped features a growing\nlist of foundation Generative AI models you can test, deploy, and implement\nfor your air-gapped applications. Foundation models are fine-tuned for specific\nuse cases and offered at different prices. This page summarizes the model\nfamilies available in the Generative AI APIs on GDC\nand guides you on which models to choose by use case.\n\nEmbeddings models\n-----------------\n\nEmbeddings convert textual data written in a natural language into numerical\nvectors. These vector representations are designed to capture the semantic\nmeaning and context of the words they represent. Text embedding models can\ngenerate optimized embeddings for various task types, such as document\nretrieval, questions and answers, classification, and fact verification. For\nEnglish text, use `text-embedding-004`. For multilingual text, use\n`text-multilingual-embedding-002`.\n\nThe following table summarizes the models available in the Embeddings API.\nFor more information on embeddings, see\n[Text embeddings](/distributed-cloud/hosted/docs/latest/gdch/application/ao-user/genai/text-embeddings-overview)."]]