Documentation de référence sur REST
Vertex AI dispose de ressources REST spécifiques à l'IA générative, ainsi que de ressources REST utilisées à la fois dans les cas d'utilisation de l'IA générative et de l'IA prédictive.
Ressources REST pour l'IA générative
Le tableau suivant répertorie les ressources REST spécifiques à l'IA générative sur Vertex AI.
Ressource d'IA générative |
Description |
---|---|
projects.locations.publishers.models.generateContent | Génère du contenu pour Gemini. |
projects.locations.publishers.models.streamGenerateContent | Diffuse du contenu généré pour Gemini. |
projects.locations.publishers.models.serverStreamingPredict | Diffuse du contenu généré pour PaLM 2 et Codey. |
projects.locations.publishers.models.predict | Génère du contenu pour des modèles autres que Gemini. |
projects.locations.publishers.models.countTokens (v1beta1) | Récupère le nombre de jetons et les caractères facturables pour une invite. |
projects.locations.tuningJobs | Règle les modèles Gemini. |
projects.locations.reasoningEngines (v1beta1) | Déploye des applications LangChain sur Vertex AI. |
Ressources REST partagées
Le tableau suivant répertorie les ressources REST partagées sur Vertex AI.
Ressource REST partagée |
Description |
---|---|
projects.locations.pipelineJobs | Utilisé pour régler des modèles autres que Gemini et pour les évaluations de modèle. |
projects.locations.batchPredictionJobs | Permet d'envoyer des requêtes d'invite par lot aux modèles compatibles. |
projects.locations.endpoints | Utilisé pour déployer des modèles Model Garden. |
Documentation de référence sur RPC
Le tableau suivant répertorie les RPC pour l'IA générative.
Package RPC |
Description |
---|---|
cloud.ai.large_models.vision | Modèles de vision volumineux. |
cloud.ai.nl.llm.proto.service | Grands modèles de langage |
learning.genai.root | Ancrage et citations. |