此页面由 Cloud Translation API 翻译。

生成记忆

借助记忆库，您可以根据用户与智能体之间的对话构建长期记忆。本页介绍了记忆生成功能的运作方式、如何自定义记忆提取方式，以及如何触发记忆生成。

如需完成本指南中演示的步骤，您必须先按照设置记忆库中的步骤操作。

了解记忆生成

记忆库从源数据中提取记忆，并通过随时间推移添加、更新和移除记忆，为特定记忆集合（由 scope 定义）自行整理记忆。

当您触发记忆生成时，记忆库会执行以下操作：

提取：从用户与代理的对话中提取有关用户的信息。只有符合实例的至少一个记忆主题的信息才会被持久保存。
整合：根据提取的信息，确定是否应删除或更新具有相同范围的现有记忆。记忆库会在合并新记忆与现有记忆之前，检查新记忆是否重复或矛盾。如果现有记忆与新信息不重叠，系统会创建新的记忆。

记忆主题

“记忆主题”用于标识记忆库认为有意义并应作为生成的记忆保留的信息。记忆库支持两种类型的记忆主题：

托管式主题：标签和说明由记忆库定义。您只需提供托管式主题的名称。例如：

字典

memory_topic = {
    "managed_memory_topic": {
        "managed_topic_enum": "USER_PERSONAL_INFO"
    }
}

基于类

from vertexai.types import ManagedTopicEnum
from vertexai.types import MemoryBankCustomizationConfigMemoryTopic as MemoryTopic
from vertexai.types import MemoryBankCustomizationConfigMemoryTopicManagedMemoryTopic as ManagedMemoryTopic

memory_topic = MemoryTopic(
    managed_memory_topic=ManagedMemoryTopic(
        managed_topic_enum=ManagedTopicEnum.USER_PERSONAL_INFO
    )
)

自定义主题：在设置记忆库实例时，您可以自行定义标签和说明。它们将用于记忆库提取步骤的提示中。例如：

字典

memory_topic = {
    "custom_memory_topic": {
        "label": "business_feedback",
        "description": """Specific user feedback about their experience at
the coffee shop. This includes opinions on drinks, food, pastries, ambiance,
staff friendliness, service speed, cleanliness, and any suggestions for
improvement."""
    }
}

基于类

from vertexai.types import MemoryBankCustomizationConfigMemoryTopic as MemoryTopic
from vertexai.types import MemoryBankCustomizationConfigMemoryTopicCustomMemoryTopic as CustomMemoryTopic

memory_topic = MemoryTopic(
    custom_memory_topic=CustomMemoryTopic(
        label="business_feedback",
        description="""Specific user feedback about their experience at
the coffee shop. This includes opinions on drinks, food, pastries, ambiance,
staff friendliness, service speed, cleanliness, and any suggestions for
improvement."""
    )
)

使用自定义主题时，建议同时提供少样本示例，以展示应如何从对话中提取记忆。

默认情况下，记忆库会保留以下所有托管式主题：

个人信息 (USER_PERSONAL_INFO)：与用户相关的重要个人信息，例如姓名、关系、爱好和重要日期。例如，“我在 Google 工作”或“我的结婚纪念日是 12 月 31 日”。
用户偏好 (USER_PREFERENCES)：明确或隐含的喜好、厌恶、偏好的风格或图案。例如，“我喜欢中间的座位。”
关键对话事件和任务结果 (KEY_CONVERSATION_DETAILS)：对话中的重要里程碑或结论。例如，“我预订了从 JFK 机场往返 SFO 机场的机票。我将于 2025 年 6 月 1 日出发，并于 2025 年 6 月 7 日返回。”
明确的记忆 / 忘记指令 (EXPLICIT_INSTRUCTIONS)：用户明确要求代理记住或忘记的信息。例如，如果用户说“记住，我主要使用 Python”，记忆库会生成一条记忆，例如“我主要使用 Python”。

这相当于使用以下一组托管式记忆主题：

字典

  memory_topics = [
      {"managed_memory_topic": {"managed_topic_enum": "USER_PERSONAL_INFO"}},
      {"managed_memory_topic": {"managed_topic_enum": "USER_PREFERENCES"}},
      {"managed_memory_topic": {"managed_topic_enum": "KEY_CONVERSATION_DETAILS"}},
      {"managed_memory_topic": {"managed_topic_enum": "EXPLICIT_INSTRUCTIONS"}},
  ]

基于类

from vertexai.types import ManagedTopicEnum
from vertexai.types import MemoryBankCustomizationConfigMemoryTopic as MemoryTopic
from vertexai.types import MemoryBankCustomizationConfigMemoryTopicManagedMemoryTopic as ManagedMemoryTopic

memory_topics = [
  MemoryTopic(
      managed_memory_topic=ManagedMemoryTopic(
          managed_topic_enum=ManagedTopicEnum.USER_PERSONAL_INFO)),
  MemoryTopic(
      managed_memory_topic=ManagedMemoryTopic(
          managed_topic_enum=ManagedTopicEnum.USER_PREFERENCES)),
  MemoryTopic(
      managed_memory_topic=ManagedMemoryTopic(
          managed_topic_enum=ManagedTopicEnum.KEY_CONVERSATION_DETAILS)),
  MemoryTopic(
      managed_memory_topic=ManagedMemoryTopic(
          managed_topic_enum=ManagedTopicEnum.EXPLICIT_INSTRUCTIONS)),
]

如果您想自定义记忆库保留的主题，请在设置记忆库时，在自定义配置中设置记忆主题。

触发记忆生成

您可以在会话结束时或在会话中定期使用 GenerateMemories 触发记忆生成。记忆生成功能会从源对话中提取关键上下文，并将其与同一范围内的现有记忆相结合。例如，您可以使用 {"user_id": "123", "session_id": "456"} 等范围创建会话级记忆。具有相同范围的记忆可以合并并一起检索。

GenerateMemories 是一项长时间运行的操作。操作完成后，AgentEngineGenerateMemoriesOperation 将包含生成的记忆列表（如果有）：

AgentEngineGenerateMemoriesOperation(
  name="projects/.../locations/.../reasoningEngines/.../operations/...",
  done=True,
  response=GenerateMemoriesResponse(
    generatedMemories=[
      GenerateMemoriesResponseGeneratedMemory(
        memory=Memory(
          "name": "projects/.../locations/.../reasoningEngines/.../memories/..."
        ),
        action="CREATED",
      ),
      GenerateMemoriesResponseGeneratedMemory(
        memory=Memory(
          "name": "projects/.../locations/.../reasoningEngines/.../memories/..."
        ),
        action="UPDATED",
      ),
      GenerateMemoriesResponseGeneratedMemory(
        memory=Memory(
          "name": "projects/.../locations/.../reasoningEngines/.../memories/..."
        ),
        action="DELETED",
      ),
    ]
  )
)

每个生成的记忆都包含对该记忆执行的 action：

CREATED：表示添加了新的记忆，代表现有记忆未捕获的新概念。
UPDATED：表示现有记忆已更新，如果记忆涵盖的概念与新提取的信息类似，就会发生这种情况。记忆中的事实可能会根据新信息进行更新，也可能保持不变。
DELETED：表示现有记忆已被删除，因为其信息与从对话中提取的新信息相矛盾。

对于 CREATED 或 UPDATED 记忆，您可以使用 GetMemories 检索记忆的完整内容。检索 DELETED 记忆会导致 404 错误。

正在后台生成记忆

GenerateMemories 是一项长时间运行的操作。默认情况下，client.agent_engines.generate_memories 是一个阻塞函数，它会轮询操作，直到操作完成。如果您想手动检查生成的记忆或通知最终用户生成了哪些记忆，将记忆生成作为阻塞操作执行会很有帮助。

不过，对于生产环境中的代理，您通常希望在后台以异步进程方式运行记忆生成。在大多数情况下，客户端不需要使用当前运行的输出，因此无需等待回答而产生额外的延迟。如果您希望记忆生成在后台执行，请将 wait_for_completion 设置为 False：

client.agent_engines.memories.generate(
    ...,
    config={
        "wait_for_completion": False
    }
)

数据源

您可以通过多种方式为记忆生成功能提供源数据：

直接在载荷中提供事件。
使用 Vertex AI Agent Engine 会话提供事件。
提供预提取的事实，以便将其与同一范围内的现有记忆整合。

当您直接在载荷中提供事件或使用 Vertex AI Agent Engine 会话时，系统会从对话中提取信息，并将其与现有记忆进行整合。如果您只想从这些数据源中提取信息，可以停用整合功能：

client.agent_engines.memories.generate(
    ...
    config={
        "disable_consolidation": True
    }
)

使用载荷中的事件作为数据源

如果您想使用直接在载荷中提供的事件生成回忆，请使用 direct_contents_source。系统会从这些事件中提取有意义的信息，并将其与同一范围内的现有信息整合。如果您使用的会话存储区不是 Vertex AI Agent Engine 会话，则可以使用此方法。

字典

相应事件应包含 Content 字典。

events =  [
  {
    "content": {
      "role": "user",
      "parts": [
        {"text": "I work with LLM agents!"}
      ]
    }
  }
]

client.agent_engines.memories.generate(
    name=agent_engine.api_resource.name,
    direct_contents_source={
      "events": EVENTS
    },
    # For example, `scope={"user_id": "123"}`.
    scope=SCOPE,
    config={
        "wait_for_completion": True
    }
)

替换以下内容：

SCOPE：一个字典，用于表示生成的记忆的范围。例如 {"session_id": "MY_SESSION"}。只有范围相同的记忆才会考虑合并。

基于类

相应事件应包含 Content 对象。

from google import genai
import vertexai

events = [
  vertexai.types.GenerateMemoriesRequestDirectContentsSourceEvent(
    content=genai.types.Content(
      role="user",
      parts=[
        genai.types.Part.from_text(text="I work with LLM agents!")
      ]
    )
  )
]

client.agent_engines.memories.generate(
    name=agent_engine.api_resource.name,
    direct_contents_source={
      "events": events
    },
    # For example, `scope={"user_id": "123"}`.
    scope=SCOPE,
    config={
        "wait_for_completion": True
    }
)

替换以下内容：

SCOPE：一个字典，用于表示生成的记忆的范围。例如 {"session_id": "MY_SESSION"}。只有范围相同的记忆才会考虑合并。

将 Vertex AI Agent Engine 会话用作数据源

借助 Agent Engine 会话，记忆库可以使用会话事件作为源对话来生成记忆。

为了限定生成的记忆的范围，记忆库默认会从会话中提取并使用用户 ID。例如，如果会话的 user_id 为“123”，则记忆的范围存储为 {"user_id": "123"}。您还可以直接提供 scope，这会替换使用会话的 user_id 作为范围。

字典

client.agent_engines.memories.generate(
  name=agent_engine.api_resource.name,
  vertex_session_source={
      # For example, projects/.../locations/.../reasoningEngines/.../sessions/...
      "session": "SESSION_NAME"
  },
  # Optional when using Agent Engine Sessions. Defaults to {"user_id": session.user_id}.
  scope=SCOPE,
  config={
      "wait_for_completion": True
  }
)

替换以下内容：

SESSION_NAME：完全限定的会话名称。
（可选）SCOPE：一个字典，用于表示生成的记忆的范围。例如 {"session_id": "MY_SESSION"}。只有范围相同的记忆才会考虑合并。如果未提供，则系统会使用 {"user_id": session.user_id}。

基于类

client.agent_engines.memories.generate(
  name=agent_engine.api_resource.name,
  vertex_session_source=vertexai.types.GenerateMemoriesRequestVertexSessionSource(
      # For example, projects/.../locations/.../reasoningEngines/.../sessions/...
      session="SESSION_NAME"
  ),
  # Optional when using Agent Engine Sessions. Defaults to {"user_id": session.user_id}.
  scope=SCOPE,
  config={
      "wait_for_completion": True
  }
)

您可以选择性地提供一个时间范围，指明应包含会话中的哪些事件。如果未提供，则会包含会话中的所有事件。

字典

import datetime

client.agent_engines.memories.generate(
  name=agent_engine.api_resource.name,
  vertex_session_source={
      "session": "SESSION_NAME",
      # Extract memories from the last hour of events.
      "start_time": datetime.datetime.now(tz=datetime.timezone.utc) - datetime.timedelta(seconds=24 * 60),
      "end_time": datetime.datetime.now(tz=datetime.timezone.utc)
  },
  scope=SCOPE
)

基于类

import datetime

client.agent_engines.memories.generate(
  name=agent_engine.api_resource.name,
  vertex_session_source=vertexai.types.GenerateMemoriesRequestVertexSessionSource(
      session="SESSION_NAME",
      # Extract memories from the last hour of events.
      start_time=datetime.datetime.now(tz=datetime.timezone.utc) - datetime.timedelta(seconds=24 * 60),
      end_time=datetime.datetime.now(tz=datetime.timezone.utc)
  ),
  scope=SCOPE
)

整合预提取的记忆内容

除了使用记忆库的自动提取流程之外，您还可以直接提供预先提取的记忆。直接来源记忆将与同一范围内的现有记忆合并。如果您希望代理或人机协同负责提取记忆，但仍想利用记忆库的整合功能来确保没有重复或矛盾的记忆，那么此功能会非常有用。

client.agent_engines.memories.generate(
    name=agent_engine.api_resource.name,
    direct_memories_source={"direct_memories": [{"fact": "FACT"}]},
    scope=SCOPE
)

替换以下内容：

FACT：应与现有记忆整合的预提取事实。您可以在列表中提供最多 5 个预提取的事实，如下所示：
```
{"direct_memories": [{"fact": "fact 1"}, {"fact": "fact 2"}]}
```
SCOPE：一个字典，用于表示生成的记忆的范围。例如 {"session_id": "MY_SESSION"}。只有范围相同的记忆才会考虑合并。

使用多模态输入

您可以从多模态输入中提取记忆。不过，系统只会从源内容中的文本、内嵌文件和文件数据中提取回忆。生成记忆时，系统会忽略所有其他内容，包括函数调用和响应。

记忆可以从用户提供的图片、视频和音频中提取。如果记忆库认为多模态输入提供的情境对未来的互动有意义，则可能会创建文本记忆，其中包含从输入中提取的信息。例如，如果用户提供了一张金毛寻回犬的图片，并附上“这是我的狗”的文字，记忆库会生成一条记忆，例如“我的狗是金毛寻回犬”。

例如，您可以在载荷中提供图片和图片上下文：

字典

with open(file_name, "rb") as f:
    inline_data = f.read()

events =  [
  {
    "content": {
      "role": "user",
      "parts": [
        {"text": "This is my dog"},
        {
          "inline_data": {
            "mime_type": "image/jpeg",
            "data": inline_data
          }
        },
        {
          "file_data": {
            "file_uri": "gs://cloud-samples-data/generative-ai/image/dog.jpg",
            "mime_type": "image/jpeg"
          }
        },
      ]
    }
  }
]

基于类

from google import genai
import vertexai

with open(file_name, "rb") as f:
    inline_data = f.read()

events = [
  vertexai.types.GenerateMemoriesRequestDirectContentsSourceEvent(
    content=genai.types.Content(
      role="user",
      parts=[
        genai.types.Part.from_text(text="This is my dog"),
        genai.types.Part.from_bytes(
          data=inline_data,
          mime_type="image/jpeg",
        ),
        genai.types.Part.from_uri(
          file_uri="gs://cloud-samples-data/generative-ai/image/dog.jpg",
          mime_type="image/jpeg",
        )
      ]
    )
  )
]

如果使用 Vertex AI Agent Engine 会话作为数据源，则多模态内容会直接在会话的事件中提供。

生成记忆

了解记忆生成

记忆主题

字典

基于类

字典

基于类

字典

基于类

触发记忆生成

正在后台生成记忆

数据源

使用载荷中的事件作为数据源

字典

基于类

将 Vertex AI Agent Engine 会话用作数据源

字典

基于类

字典

基于类

整合预提取的记忆内容

使用多模态输入

字典

基于类

后续步骤