Documentation de référence sur REST et RPC pour les services d'IA générative

Vous trouverez les pages de référence de l'API REST et RPC pour les services d'IA générative dans la documentation de référence de Vertex AI.

Documentation de référence sur REST

Vertex AI dispose de ressources REST spécifiques à l'IA générative, ainsi que de ressources REST utilisées à la fois dans les cas d'utilisation de l'IA générative et de l'IA prédictive.

Ressources REST pour l'IA générative

Le tableau suivant répertorie les ressources REST spécifiques à l'IA générative sur Vertex AI.

Ressource d'IA générative	Description
projects.locations.publishers.models.generateContent	Génère du contenu pour Gemini.
projects.locations.publishers.models.streamGenerateContent	Diffuse du contenu généré pour Gemini.
projects.locations.publishers.models.serverStreamingPredict	Diffuse du contenu généré pour PaLM 2 et Codey.
projects.locations.publishers.models.predict	Génère du contenu pour des modèles autres que Gemini.
projects.locations.publishers.models.countTokens (v1beta1)	Récupère le nombre de jetons et les caractères facturables pour une invite.
projects.locations.tuningJobs	Règle les modèles Gemini.
projects.locations.reasoningEngines (v1beta1)	Déploye des applications LangChain sur Vertex AI.

Ressources REST partagées

Le tableau suivant répertorie les ressources REST partagées sur Vertex AI.

Ressource REST partagée	Description
projects.locations.pipelineJobs	Utilisé pour régler des modèles autres que Gemini et pour les évaluations de modèle.
projects.locations.batchPredictionJobs	Permet d'envoyer des requêtes d'invite par lot aux modèles compatibles.
projects.locations.endpoints	Utilisé pour déployer des modèles Model Garden.

Documentation de référence sur RPC

Le tableau suivant répertorie les RPC pour l'IA générative.

Package RPC	Description
cloud.ai.large_models.vision	Modèles de vision volumineux.
cloud.ai.nl.llm.proto.service	Grands modèles de langage
learning.genai.root	Ancrage et citations.