Gérer l'application déployée

Opérations de base

Vous pouvez répertorier les instances ReasoningEngine, récupérer une instance ReasoningEngine ou supprimer une instance ReasoningEngine.

Répertorier les instances ReasoningEngine

SDK Vertex AI pour Python

La commande suivante répertorie toutes les instances ReasoningEngine d'un projet et d'un emplacement donnés :

reasoning_engines.ReasoningEngine.list()

Le code suivant filtre la liste des instances ReasoningEngine par display_name :

reasoning_engines.ReasoningEngine.list(filter='display_name="DISPLAY_NAME"')

Par exemple,

reasoning_engines.ReasoningEngine.list(filter='display_name="Demo Langchain Application"')

REST

Exécutez la commande curl suivante pour répertorier toutes les instances ReasoningEngine d'un projet et d'un emplacement donnés :

curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines

Obtenir une instance ReasoningEngine

Chaque instance ReasoningEngine possède un identifiant RESOURCE_ID unique. Pour en savoir plus, consultez Déployer l'application.

SDK Vertex AI pour Python

Le code suivant vous permet d'obtenir une ressource ReasoningEngine spécifique :

remote_app = reasoning_engines.ReasoningEngine("RESOURCE_ID")

Vous pouvez également indiquer le nom complet de la ressource :

remote_app = reasoning_engines.ReasoningEngine(
"projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"
)

REST

Exécutez la commande curl suivante pour obtenir une ressource ReasoningEngine spécifique :

curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

Mettre à jour une instance ReasoningEngine

SDK Vertex AI pour Python

Le code suivant vous permet de supprimer une instance ReasoningEngine définie sur la variable remote_app :

remote_app.update(
    reasoning_engine=UPDATED_AGENT_INSTANCE,  # Optional.
    requirements=REQUIREMENTS,                # Optional.
    display_name="DISPLAY_NAME",              # Optional.
    description="DESCRIPTION",                # Optional.
    extra_packages=EXTRA_PACKAGES,            # Optional.
)

Les arguments sont les mêmes que lorsque vous déployez l'application. Pour en savoir plus, consultez la documentation de référence de l'API.

REST

Exécutez la commande curl suivante pour mettre à jour le nom à afficher et la description d'une ressource ReasoningEngine :

curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description" \
-d '{ "displayName": "DISPLAY_NAME", "description": "DESCRIPTION" }'

Supprimer une instance ReasoningEngine

SDK Vertex AI pour Python

Le code suivant vous permet de supprimer une instance ReasoningEngine définie sur la variable remote_app :

remote_app.delete()

REST

Chaque instance ReasoningEngine possède un identifiant RESOURCE_ID unique. Pour en savoir plus, consultez Déployer l'application.

Exécutez la commande curl suivante pour supprimer une instance ReasoningEngine spécifique :

curl \
-X DELETE \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

Traçage pour une instance LangchainAgent

Pour activer le traçage des applications LangchainAgent, spécifiez enable_tracing=True lorsque vous développez l'application. Exemple :

agent = reasoning_engines.LangchainAgent(
    model=model,                # Required.
    tools=[get_exchange_rate],  # Optional.
    enable_tracing=True,        # [New] Optional.
)

agent.query(input="What is the exchange rate from US dollars to Swedish currency?")

Cela exportera des traces vers Cloud Trace sous le projet dans Configurer votre projet Google Cloud.

Afficher les traces

Vous trouverez les traces dans l'explorateur Trace.

Accéder à l'explorateur Trace

Le diagramme de Gantt suivant montre le résultat de la trace de l'application exemple de la section Développer une application :

Exemple de trace pour une requête 

La première ligne du diagramme de Gantt correspond à la trace et il existe une ligne pour chaque segment de la trace, qui décrit la durée de chaque sous-opération.

Pour en savoir plus, consultez la documentation de l'explorateur Trace.

Activer le traçage pour une application personnalisée

Afin d'activer le traçage pour les applications personnalisées, vous pouvez utiliser l'intégration Google Cloud Open Telemetry en combinaison avec un framework d'instrumentation tel qu'OpenInference ou OpenLLMetry.

Quotas et limites

Certaines valeurs d'attributs peuvent être tronquées lorsqu'elles atteignent les limites de quota. Pour en savoir plus, consultez la page Quota Cloud Trace.

Coût

Cloud Trace propose une version gratuite. Pour aller au-delà de la version gratuite, consultez la page Tarifs de Cloud Trace.