Documentation de référence sur REST et RPC pour les services d'IA générative

Vous trouverez les pages de référence de l'API REST et RPC pour les services d'IA générative dans la documentation de référence de Vertex AI.

Documentation de référence sur REST

Vertex AI dispose de ressources REST spécifiques à l'IA générative, ainsi que de ressources REST utilisées à la fois dans les cas d'utilisation de l'IA générative et de l'IA prédictive.

Ressources REST pour l'IA générative

Le tableau suivant répertorie les ressources REST spécifiques à l'IA générative sur Vertex AI.

Ressource d'IA générative
Description
projects.locations.publishers.models.generateContent Génère du contenu pour Gemini.
projects.locations.publishers.models.streamGenerateContent Diffuse du contenu généré pour Gemini.
projects.locations.publishers.models.serverStreamingPredict Diffuse du contenu généré pour PaLM 2 et Codey.
projects.locations.publishers.models.predict Génère du contenu pour des modèles autres que Gemini.
projects.locations.publishers.models.countTokens (v1beta1) Récupère le nombre de jetons et les caractères facturables pour une invite.
projects.locations.tuningJobs Règle les modèles Gemini.
projects.locations.reasoningEngines (v1beta1) Déploye des applications LangChain sur Vertex AI.

Ressources REST partagées

Le tableau suivant répertorie les ressources REST partagées sur Vertex AI.

Ressource REST partagée
Description
projects.locations.pipelineJobs Utilisé pour régler des modèles autres que Gemini et pour les évaluations de modèle.
projects.locations.batchPredictionJobs Permet d'envoyer des requêtes d'invite par lot aux modèles compatibles.
projects.locations.endpoints Utilisé pour déployer des modèles Model Garden.

Documentation de référence sur RPC

Le tableau suivant répertorie les RPC pour l'IA générative.

Package RPC
Description
cloud.ai.large_models.vision Modèles de vision volumineux.
cloud.ai.nl.llm.proto.service Grands modèles de langage
learning.genai.root Ancrage et citations.