Présentation de la banque de mémoire Vertex AI Agent Engine
Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
La banque de mémoire Vertex AI Agent Engine vous permet de générer de manière dynamique des souvenirs à long terme en fonction des conversations des utilisateurs avec votre agent. Les souvenirs à long terme sont des informations personnalisées auxquelles un utilisateur peut accéder au fil des sessions. L'agent peut utiliser les infos mémorisées pour personnaliser les réponses à l'utilisateur et assurer la continuité entre les sessions.
Voici quelques fonctionnalités de la Banque de souvenirs :
Stockage persistant des souvenirs, accessible depuis plusieurs environnements. Vous pouvez utiliser les sessions et la banque de mémoire Vertex AI Agent Engine avec votre agent déployé sur Vertex AI Agent Engine Runtime, depuis votre environnement local ou avec d'autres options de déploiement.
Extraction de souvenirs à partir de l'historique des conversations à l'aide d'un grand modèle de langage (LLM).
Les souvenirs sont générés à distance de manière asynchrone. L'agent n'a donc pas besoin d'attendre leur génération.
Récupération de souvenirs basée sur la recherche de similarités et limitée à une identité (scope).
Si vous utilisez la banque de mémoire Vertex AI Agent Engine avec Agent Development Kit, votre agent peut orchestrer des appels pour lire et écrire des souvenirs à long terme à l'aide de la banque de mémoire.
Vous pouvez utiliser la banque de mémoire avec les sessions Vertex AI Agent Engine pour générer des souvenirs à partir des sessions stockées en procédant comme suit :
(Sessions) CreateSession : créez une session au début de chaque conversation. L'historique des conversations utilisé par l'agent est limité à cette session. Une session contient la séquence chronologique des messages et des actions (SessionEvents) pour une interaction entre un utilisateur et votre agent. Toutes les sessions doivent avoir un ID utilisateur. Les souvenirs extraits (voir GenerateMemories) pour cette session sont associés à cet utilisateur.
(Sessions) AppendEvent : lorsque l'utilisateur interagit avec l'agent, les événements (comme les messages de l'utilisateur, les réponses de l'agent et les actions des outils) sont importés dans les sessions. Les événements conservent l'historique des conversations et créent un enregistrement de la conversation qui peut être utilisé pour générer des souvenirs.
(Sessions) ListEvents : lorsque l'utilisateur interagit avec l'agent, celui-ci récupère l'historique des conversations.
(Memory Bank) Générer ou créer des souvenirs :
GenerateMemories : à un intervalle spécifié (par exemple, à la fin de chaque session ou de chaque tour), l'agent peut déclencher la génération de souvenirs à partir de l'historique des conversations. Les informations sur l'utilisateur sont automatiquement extraites de l'historique des conversations afin d'être disponibles pour les sessions actuelles ou futures.
CreateMemory : votre agent peut écrire des souvenirs directement dans la banque de mémoire. Par exemple, l'agent peut décider quand une mémoire doit être écrite et quelles informations doivent être enregistrées (mémoire en tant qu'outil). Utilisez CreateMemory lorsque vous souhaitez que votre agent ait plus de contrôle sur les faits extraits.
(Memory Bank) RetrieveMemories : lorsque l'utilisateur interagit avec votre agent, celui-ci peut récupérer les souvenirs enregistrés à son sujet. Vous pouvez récupérer tous les souvenirs (récupération simple) ou uniquement ceux qui sont les plus pertinents pour la conversation en cours (récupération par recherche de similarités). Vous pouvez ensuite insérer les souvenirs récupérés dans votre requête.
Guides de démarrage rapide
Pour commencer à utiliser Memory Bank, consultez les guides de démarrage rapide suivants :
Guide de démarrage rapide avec l'API REST : suivez le guide de démarrage rapide de l'API REST pour effectuer des appels d'API directement vers les sessions et la banque de mémoire Vertex AI Agent Engine.
En plus des responsabilités en termes de sécurité décrites dans Responsabilité partagée de Vertex AI, tenez compte du risque d'injection d'invite et d'empoisonnement de la mémoire qui peuvent affecter votre agent lorsque vous utilisez des mémoires à long terme. L'empoisonnement de la mémoire se produit lorsque de fausses informations sont stockées dans la banque de mémoire. L'agent peut ensuite utiliser ces informations fausses ou malveillantes lors de futures sessions.
Pour limiter le risque d'empoisonnement de la mémoire, vous pouvez procéder comme suit :
Model Armor : utilisez Model Armor pour inspecter les requêtes envoyées à la banque de mémoire ou depuis votre agent.
Tests antagonistes : testez de manière proactive votre application LLM pour détecter les failles d'injection de requête en simulant des attaques. C'est ce que l'on appelle généralement le "red teaming".
Exécution en bac à sable : si l'agent est capable d'exécuter des actions ou d'interagir avec des systèmes externes ou critiques, ces actions doivent être effectuées dans un environnement de bac à sable avec contrôle des accès strict et un examen humain.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/09/04 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/09/04 (UTC)."],[],[],null,["# Vertex AI Agent Engine Memory Bank overview\n\n| **Preview**\n|\n|\n| This feature is subject to the \"Pre-GA Offerings Terms\" in the General Service Terms section\n| of the [Service Specific Terms](/terms/service-terms#1).\n|\n| Pre-GA features are available \"as is\" and might have limited support.\n|\n| For more information, see the\n| [launch stage descriptions](/products#product-launch-stages).\n\nVertex AI Agent Engine Memory Bank lets you dynamically generate long-term memories based on users' conversations with your agent. Long-term memories are personalized information that can be accessed across multiple sessions for a particular user. The agent can use the memories to personalize responses to the user and create cross-session continuity.\n\nFeatures of Memory Bank include the following:\n\n- Persistent storage of memories that can be accessed from multiple environments. You can use Vertex AI Agent Engine Sessions and Memory Bank with your deployed agent on Vertex AI Agent Engine Runtime, from your local environment, or with other deployment options.\n\n- Large language model (LLM)-based extraction of memories from conversation history.\n\n- Memories are remotely generated asynchronously, so the agent doesn't need to wait for memories to be generated.\n\n- Similarity search-based retrieval of memories scoped to an identity ([`scope`](/vertex-ai/generative-ai/docs/agent-engine/memory-bank/fetch-memories#scope-based)).\n\n- If you use Vertex AI Agent Engine Memory Bank with Agent Development Kit, your agent can orchestrate calls to read and write long-term memories using Memory Bank.\n\nYou can use Memory Bank with Vertex AI Agent Engine Sessions to generate memories from stored sessions using the following process:\n\n1. **(Sessions) `CreateSession`** : At the start of each conversation, create a new session. The conversation history used by the agent is scoped to this session. A session contains the chronological sequence of messages and actions (`SessionEvents`) for an interaction between a user and your agent. All sessions must have a user ID; the extracted memories (see `GenerateMemories`) for this session are mapped to this user.\n\n2. **(Sessions) `AppendEvent`**: As the user interacts with the agent, events (such as user messages, agent responses, tool actions) are uploaded to Sessions. The events persist conversation history and create a record of the conversation that can be used to generate memories.\n\n3. **(Sessions) `ListEvents`**: As the user interacts with the agent, the agent retrieves the conversation history.\n\n4. **(Memory Bank)** Generate or create memories:\n\n - **`GenerateMemories`**: At a specified interval (such as the end of every session or the end of every turn), the agent can trigger memories to be generated using conversation history. Facts about the user are automatically extracted from the conversation history so that they're available for current or future sessions.\n\n - **`CreateMemory`** : Your agent can write memories directly to Memory Bank. For example, the agent can decide when a memory should be written and what information should be saved (memory-as-a-tool). Use `CreateMemory` when you want your agent to have more control over what facts are extracted.\n\n5. **(Memory Bank) `RetrieveMemories`**: As the user interacts with your agent, the agent can retrieve memories saved about that user. You can either retrieve all memories (simple retrieval) or only the most relevant memories to the current conversation (similarity search retrieval). Then you can insert the retrieved memories into your prompt.\n\nQuickstarts\n-----------\n\nGet started with Memory Bank using the following quickstarts:\n\n- [**Quickstart using REST API**](/vertex-ai/generative-ai/docs/agent-engine/memory-bank/quickstart-api): Follow the REST API quickstart to make API calls directly to Vertex AI Agent Engine Sessions and Memory Bank.\n\n- [**Quickstart using Agent Development Kit (ADK)**](/vertex-ai/generative-ai/docs/agent-engine/memory-bank/quickstart-adk): Follow the Agent Development Kit (ADK) quickstart if you want your ADK agent to orchestrate calls to Vertex AI Agent Engine Sessions and Memory Bank for you.\n\nSecurity risks of prompt injection\n----------------------------------\n\nIn addition to the security responsibilities outlined in [Vertex AI shared responsibility](/vertex-ai/docs/shared-responsibility), consider the risk of prompt injection and memory poisoning that can affect your agent when using long-term memories. Memory poisoning occurs when false information is stored in Memory Bank. The agent may then operate on this false or malicious information in future sessions.\n\nTo mitigate the risk of memory poisoning, you can do the following:\n\n- **Model Armor** : Use [Model Armor](/security-command-center/docs/model-armor-overview) to inspect prompts being sent to Memory Bank or from your agent.\n\n- **Adversarial testing**: Proactively test your LLM application for prompt injection vulnerabilities by simulating attacks. This is typically known as \"red teaming.\"\n\n- **Sandbox execution**: If the agent has the ability to execute or interact with external or critical systems, these actions should be performed in a sandboxed environment with strict access control and human review.\n\nFor more information, see [Google's Approach for Secure AI Agents](https://research.google/pubs/an-introduction-to-googles-approach-for-secure-ai-agents/).\n\nWhat's next\n-----------\n\n- [Set up Memory Bank](/vertex-ai/generative-ai/docs/agent-engine/memory-bank/set-up).\n- [Quickstart with Agent Development Kit](/vertex-ai/generative-ai/docs//agent-engine/memory-bank/quickstart-adk).\n- [Quickstart with Vertex AI Agent Engine SDK](/vertex-ai/generative-ai/docs//agent-engine/memory-bank/quickstart-api)."]]