此页面由 Cloud Translation API 翻译。

Vertex AI RAG Engine 支持的模型

本页面列出了 Vertex AI 上支持 Vertex AI RAG 引擎的 Gemini 模型、自行部署的模型以及具有托管式 API 的模型。

Gemini 模型

以下模型支持 Vertex AI RAG 引擎：

当 Gemini 模型使用 Vertex AI RAG Engine 时，不支持对 Gemini 模型进行微调。

自行部署的模型

Vertex AI RAG 引擎支持 Model Garden 中的所有模型。

将 Vertex AI RAG 引擎与自行部署的开放模型端点搭配使用。

替换代码示例中使用的变量：

PROJECT_ID：您的项目 ID。
LOCATION：处理请求的区域。

ENDPOINT_ID：您的端点 ID。

  # Create a model instance with your self-deployed open model endpoint
  rag_model = GenerativeModel(
      "projects/PROJECT_ID/locations/LOCATION/endpoints/ENDPOINT_ID",
      tools=[rag_retrieval_tool]
  )

Vertex AI 上具有托管式 API 的模型

Vertex AI 上支持 Vertex AI RAG 引擎的具有托管式 API 的模型包括：

以下代码示例演示了如何使用 Gemini GenerateContent API 创建生成式模型实例。模型 ID /publisher/meta/models/llama-3.1-405B-instruct-maas 可在模型卡片中找到。

替换代码示例中使用的变量：

PROJECT_ID：您的项目 ID。
LOCATION：处理请求的区域。

RAG_RETRIEVAL_TOOL：您的 RAG 检索工具。

  # Create a model instance with Llama 3.1 MaaS endpoint
  rag_model = GenerativeModel(
      "projects/PROJECT_ID/locations/LOCATION/publisher/meta/models/llama-3.1-405B-instruct-maas",
      tools=RAG_RETRIEVAL_TOOL
  )

以下代码示例演示了如何使用与 OpenAI 兼容的 ChatCompletions API 生成模型回答。

替换代码示例中使用的变量：

PROJECT_ID：您的项目 ID。
LOCATION：处理请求的区域。
MODEL_ID：用于内容生成的 LLM 模型。例如 meta/llama-3.1-405b-instruct-maas。
INPUT_PROMPT：发送到 LLM 用于生成内容的文本。使用与 Vertex AI Search 中文档相关的提示。
RAG_CORPUS_ID：RAG 语料库资源的 ID。
ROLE：您的角色。
USER：您的用户名。

CONTENT：您的内容。

  # Generate a response with Llama 3.1 MaaS endpoint
  response = client.chat.completions.create(
      model="MODEL_ID",
      messages=[{"ROLE": "USER", "content": "CONTENT"}],
      extra_body={
          "extra_body": {
              "google": {
                  "vertex_rag_store": {
                      "rag_resources": {
                          "rag_corpus": "RAG_CORPUS_ID"
                      },
                      "similarity_top_k": 10
                  }
              }
          }
      },
  )

后续步骤

将嵌入模型与 Vertex AI RAG 引擎搭配使用。

Vertex AI RAG Engine 支持的模型 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

Gemini 模型

自行部署的模型

Vertex AI 上具有托管式 API 的模型

后续步骤

Vertex AI RAG Engine 支持的模型