English
Deutsch
Español
Español – América Latina
Français
Indonesia
Italiano
Português
Português – Brasil
中文 – 简体
中文 – 繁體
日本語
한국어

控制台

联系我们免费开始使用吧

Vertex AI 预测性 AI 术语表

注释集
- 注释集包含与数据集中上传的源文件关联的标签。注释集与数据类型和目标（例如视频/分类）相关联。
API 端点
- API 端点是一个服务配置层面，用于指定网络地址（也称为服务端点，例如 aiplatform.googleapis.com）。
应用默认凭证 (ADC)
- 应用默认凭证 (ADC) 提供了一种简单的方法来获取授权凭据，以便用于调用 Google API。它们最适合于当调用需要具有与用户无关的应用的相同身份和授权级别的情况。建议您使用此方法来授权调用 Google Cloud Platform API，此方法尤其适合在构建部署到 Google App Engine (GAE) 或 Compute Engine 虚拟机的应用时使用。如需了解详情，请参阅应用默认凭据的工作原理。
近似最邻近 (ANN)
- 近似最邻近 (ANN) 服务是一项大规模、低延迟的解决方案，可用于针对大型语料库查找类似向量（更具体地说，是“嵌入”）。如需了解详情，请参阅如何使用向量搜索进行语义匹配。
工件
- 工件是机器学习工作流生成和使用的离散实体或数据块。工件的示例包括数据集、模型、输入文件和训练日志。
Artifact Registry
- Artifact Registry 是通用的工件管理服务。它是在 Google Cloud 上管理容器和其他工件时推荐使用的服务。如需了解详情，请参阅 Artifact Registry。
人工智能 (AI)
- 人工智能（简称 AI）是指对看起来“智能”的机器进行研究和设计，也就是说，机器能够模仿人类或智力功能，例如机械运动、推理或解决问题。AI 最热门的子领域之一是机器学习，它使用统计和数据驱动的方法来创建 AI。不过，有些人会混用这两个术语。
身份验证
- 此过程验证客户端（可能是用户或其他进程）的身份，以便获得对受保护系统的访问权限。已证明其身份的客户端即被认定为已通过身份验证。如需了解详情，请参阅 Google 的身份验证方法。
自动并排评估 (AutoSxS)
- 自动并排评估 (AutoSxS) 是一种模型辅助评估工具，用于并排比较两个大语言模型 (LLM)。它可用于评估 Vertex AI Model Registry 中的生成式 AI 模型或预生成的推理的性能。AutoSxS 使用自动评估器来决定哪个模型能更好地响应提示。AutoSxS 是按需提供的，用于评估语言模型，与人工标注者的评估效果相当。
AutoML
- 通过黑盒优化“学会学习”的机器学习算法。如需了解详情，请参阅 ML 术语表。
自动日志记录
- 自动日志记录是机器学习平台和库中的一项功能，可在模型训练过程中自动记录关键指标、参数和制品，而无需显式进行代码插桩。它会自动捕获超参数、评估指标（例如准确率、损失）和模型检查点等信息，从而简化实验跟踪，让开发者能够轻松比较和重现实验。
自动评估器
- 自动评估器是一种语言模型，可根据原始推理提示评估模型回答的质量。它用于 AutoSxS 流水线中，以比较两个模型的推理结果并确定哪个模型的性能最好。如需了解详情，请参阅自动评估器。
自动扩缩
- 自动扩缩是指计算资源（例如 Ray 集群的工作器池）能够根据工作负载需求自动增加或减少节点数量，从而优化资源利用率和费用。如需了解详情，请参阅在 Vertex AI 上扩缩 Ray 集群：自动扩缩。
baseline
- 一种用作参考点的模型，用于比较另一模型（通常是更复杂的模型）的效果。例如，逻辑回归模型可以作为深度模型的良好基准。对于特定问题，基准有助于模型开发者量化新模型必须达到的最低预期性能，以便新模型发挥作用。如需了解详情，请参阅基准数据集和目标数据集。
批次
- 一次训练迭代中使用的示例集。批次大小决定了一个批次中的样本数量。
批次大小
- 一个批次中的样本数。例如，SGD 的批次大小为 1，而小批次的批次大小通常介于 10 到 1000 之间。批次大小在训练和推断期间通常是固定的；不过，TensorFlow 允许使用动态批次大小。
批量推理
- 批量推理会接收一组推理请求作为输入，并将结果输出到一个文件中。如需了解详情，请参阅概览：在 Vertex AI 上进行推理。
偏见
- 1. 对某些事物、人或群体持有刻板印象、成见或好感。这些偏见会影响数据的收集和解读、系统设计以及用户与系统的互动方式。2. 采样或报告过程中引入的系统错误。
双向
- 一种用于描述评估目标文本部分之前和之后文本的系统的术语。相比之下，单向系统仅评估目标文本部分之前的文本。
基于 Transformer 的双向编码器表示法 (BERT)
- BERT 是一种预训练语言表示法的方法，这意味着我们在大型文本语料库（如维基百科）上训练一个通用“语言理解”模型，然后将该模型用于我们关心的下游 NLP 任务（如问答）。BERT 优于之前的方法，因为它是第一个用于预训练 NLP 的无监督深度双向系统。
BigQuery
- BigQuery 是 Google Cloud 提供的一种全托管式、无服务器且高度可扩缩的企业数据仓库，旨在以极快的速度使用 SQL 查询分析海量数据集。BigQuery 可实现强大的商业智能和分析功能，且无需用户管理任何基础设施。如需了解详情，请参阅从数据仓库到自治数据和 AI 平台。
BigQuery ML
- BigQuery ML 是 Google Cloud 的 BigQuery 数据仓库中的一项功能，可让数据分析师和数据科学家直接在 BigQuery 内使用标准 SQL 查询创建、训练和部署机器学习模型。这样一来，您无需将数据迁移到单独的机器学习平台，从而简化了机器学习工作流，并让 SQL 用户更轻松地使用机器学习。如需了解详情，请参阅在 BigQuery ML 中创建机器学习模型。
Bigtable
- 一项全托管式 NoSQL 数据库服务，在使用 Vertex AI 时，也建议将其作为训练数据的存储选项。如需了解详情，请参阅 Bigtable 概览。
双语替换评测 (BLEU)
- 一种常用的指标，用于通过将机器翻译算法的输出与一个或多个人工翻译的输出进行比较，来评估该算法的质量。
边界框
- 视频帧中对象的边界框可通过以下两种方式之一指定：(i) 使用 2 个包含一组 x、y 坐标的顶点（如果这些点与矩形的对角线相对）。例如：x_relative_min、y_relative_min 以及 x_relative_max、y_relative_max (ii) 使用全部 4 个顶点。如需了解详情，请参阅准备视频数据。
存储桶
- Cloud Storage 的顶级文件夹。存储桶名称必须在所有 Cloud Storage 用户中保持唯一。存储桶包含文件。如需了解详情，请参阅 Cloud Storage 产品概览。
聊天
- 与机器学习系统（通常是大语言模型）进行来回对话的内容。聊天中的上一次互动（您输入的内容以及大语言模型的回答）会成为聊天后续部分的上下文。聊天机器人是大语言模型的一种应用。
checkpoint
- 在训练期间或训练完成后捕获模型参数状态的数据。例如，在训练期间，您可以：1. 停止训练，可能是有意为之，也可能是由于某些错误。2. 捕获检查点。3. 稍后，请重新加载检查点，可能需要在其他硬件上进行。4. 重新开始训练。在 Gemini 中，检查点是指在特定数据集上训练的 Gemini 模型的特定版本。
分类模型
- 推理结果为类别的模型。例如，以下都是分类模型：一个模型，用于预测输入句子的语言（法语？西班牙语？意大利语？）。一个模型，用于预测树种（枫树？橡树？猴面包树？）。用于预测特定医疗状况的正类别或负类别的模型。
分类指标
- Python 版 Vertex AI SDK 中支持的分类指标是混淆矩阵和 ROC 曲线。
Cloud Logging
- Cloud Logging 是 Google Cloud 提供的一项全托管式实时日志记录服务，可让您收集、存储、分析和监控来自所有 Google Cloud 资源、本地应用甚至自定义来源的日志。Cloud Logging 可集中管理日志，从而更轻松地排查问题、进行审核，以及了解应用及基础设施的行为和健康状况。如需了解详情，请参阅 Cloud Logging 概览。
Cloud Monitoring
- Cloud Monitoring 是 Google Cloud 提供的一款全面的可观测性平台，可从 Google Cloud 服务、本地基础设施和应用组件中收集指标、日志和事件，并以直观的方式呈现这些数据。它可帮助用户深入了解系统的性能、可用性和总体运行状况，从而主动检测、排查问题并发出提醒。如需了解详情，请参阅适用于 Vertex AI 的 Cloud Monitoring 指标。
Cloud 网络地址转换 (Cloud NAT)
- Cloud NAT（网络地址转换）是一项完全由 Google Cloud 管理的服务，可让没有外部 IP 地址的虚拟机实例和其他资源连接到互联网。如需了解详情，请参阅 Cloud NAT 文档。
Cloud Profiler
- Cloud Profiler 是 Google Cloud 提供的一项持续性能剖析服务，可帮助您识别和分析应用中的 CPU 和内存消耗情况，以及其他资源使用情况（例如堆、实际运行时间、争用）。它会自动从生产应用中收集分析数据，开销极低，让您可以直观了解并找出各种服务中的性能瓶颈，并优化代码以提高效率和降低费用。如需了解详情，请参阅 Cloud Profiler 概览。
Cloud Router
- Cloud Router 是一项分布式全托管式服务，可提供边界网关协议 (BGP) 发言者和响应者功能。Cloud Router 可与 Cloud Interconnect、Cloud VPN、Cloud NAT 和路由器设备配合使用，根据 BGP 收到的路由和自定义已知路由在 VPC 网络中创建动态路由。如需了解详情，请参阅 Cloud Router 概念概览。
Cloud Storage
- Google Cloud 的可伸缩且安全的对象存储服务，建议用于存储大型数据集，以便在 Vertex AI 中进行训练和验证，从而实现最佳性能。如需了解详情，请参阅 Cloud Storage 文档。
Cloud Storage Fuse
- 一种开源 FUSE 适配器，可让您将 Cloud Storage 存储桶作为文件系统装载到 Linux 或 macOS 系统上。如需了解详情，请参阅 Cloud Storage Fuse。
Cloud TPU
- 一种专门的硬件加速器，旨在加快 Google Cloud 上的机器学习工作负载的处理速度。
Colab Enterprise
- Colab Enterprise 是一个托管式协作 Jupyter 笔记本环境，可将广受欢迎的 Google Colab 用户体验集成到 Google Cloud 中，并可提供企业级安全性和合规性功能。Colab Enterprise 提供以笔记本为中心的零配置体验，计算资源均由 Vertex AI 管理，并且可与其他 Google Cloud 服务（例如 BigQuery）相集成。如需了解详情，请参阅 Colab Enterprise 简介。
消费者 VPC
- 使用方虚拟私有云 (VPC) 网络用于从其 VPC 网络内部以私密方式访问托管式服务。如需了解详情，请参阅 Private Service Connect。
容器映像
- 容器映像是一个软件包，其中包含组件的可执行代码和代码运行环境的定义。如需了解详情，请参阅自定义训练概览。
上下文
- 上下文用于将工件和执行分组到单个可查询的类型化类别下。上下文可用于表示元数据集。例如，上下文可以是机器学习流水线的运行。
上下文缓存
- Vertex AI 中的上下文缓存是指可用于向 Gemini 模型发出多个请求的大量数据。缓存的内容存储在发出创建缓存请求的区域中。可以是多模态 Gemini 模型支持的任何 MIME 类型，例如文本、音频或视频。如需了解详情，请参阅上下文缓存概览。
上下文窗口
- 模型可在给定提示中处理的 token 数量。上下文窗口越大，模型可用于提供连贯一致的提示回答的信息就越多。
客户管理的加密密钥 (CMEK)
- 客户管理的加密密钥 (CMEK) 是一项集成功能，可让客户使用其在 Cloud KMS 中管理的密钥（也称为 Storky）加密现有 Google 服务中的数据。Cloud KMS 中的密钥是用于保护其数据的密钥加密密钥。如需了解详情，请参阅客户管理的加密密钥 (CMEK)。
使用方 VPC 网络
- 使用方 VPC 网络是指以私密方式访问托管在另一个 VPC（称为提供方 VPC）中的服务的 Google Cloud 虚拟私有云 (VPC)。如需了解详情，请参阅 Private Service Connect。
CustomJob
- CustomJob 是用户可创建的三种 Vertex AI 资源之一，可用于在 Vertex AI 上训练自定义模型。自定义训练作业是在 Vertex AI 中运行自定义机器学习 (ML) 训练代码的基本方法。如需了解详情，请参阅创建自定义训练作业。
自定义容器映像
- 自定义容器映像是一个独立的可执行软件包，其中包含用户的应用代码、运行时、库、依赖项和环境配置。在 Google Cloud（尤其是 Vertex AI）环境中，它让用户能够将其机器学习训练代码或服务应用及其确切的依赖项打包在一起，从而确保可重现性，并使用户能够使用标准环境未提供的特定软件版本或独特配置在托管式服务上运行工作负载。如需了解详情，请参阅推理的自定义容器要求。
自定义训练
- Vertex AI 自定义训练是一项灵活的服务，可让用户在 Google Cloud 基础设施上运行自己的自定义训练应用（脚本或容器），从而控制机器类型和伸缩。如需了解详情，请参阅自定义训练概览。
Dask
- Dask 是一个分布式计算平台，通常与 TensorFlow、Pytorch 和其他机器学习框架搭配使用，以管理分布式训练作业。如需了解详情，请参阅 Wikipedia。
数据分析
- 根据样本、测量结果和可视化内容理解数据。数据分析在首次收到数据集时且构建第一个模型之前特别有用。此外，数据分析在理解实验和调试系统问题方面也至关重要。
数据增强
- 通过转换现有样本创建其他样本，人为地增加训练样本的范围和数量。例如，假设图像是其中一个特征，但数据集包含的图像样本不足以供模型学习有用的关系。理想情况下，您需要向数据集添加足够的有标签图像，才能使模型正常训练。如果不可行，则可以通过数据增强旋转、拉伸和翻转每张图像，以生成原始照片的多个变体，这样可能会生成足够的有标签数据来实现很好的训练效果。
数据中心 GPU 管理器 (DCGM)
- NVIDIA 提供的一套工具，用于管理和监控数据中心环境中的 NVIDIA GPU。如需了解详情，请参阅 NVIDIA 数据中心 GPU 管理器 (DCGM)。
DataFrame
- 一种热门的 Pandas 数据类型，用于表示内存中的数据集。DataFrame 类似于表格或电子表格。DataFrame 的每一列都有一个名称（标题），每一行都由一个唯一编号标识。DataFrame 中的每一列都以二维数组的形式构建，但每一列都可以分配自己的数据类型。
数据集
- 数据集被广泛定义为结构化或非结构化数据记录的集合。一组原始数据，通常（但不限于）以以下格式之一组织：电子表格、CSV（逗号分隔值）格式的文件。有关详情，请参阅创建数据集
解码器
- 一般来说，任何将经过处理的密集型内部表示形式转换为更原始的稀疏型外部表示形式的机器学习系统。解码器通常是较大模型的组成部分，并且经常与编码器配对使用。在序列到序列任务中，解码器从编码器生成的内部状态开始预测下一个序列。
深度神经网络 (DNN)
- 具有多个隐藏层的神经网络，通常通过深度学习技术进行编程。
depth
- 神经网络中以下各项的总和：1. 隐藏层的数量；2. 输出层的数量（通常为 1）；3. 任何嵌入层的数量。例如，具有 5 个隐藏层和 1 个输出层的神经网络的深度为 6。请注意，输入层不会影响深度。
DevOps
- DevOps 是一套 Google Cloud Platform 产品，例如 Artifact Registry、Cloud Deploy。
早停法
- 一种正则化方法，涉及在训练损失停止下降之前结束训练。在早停法中，当验证数据集的损失开始增加时（即泛化性能变差时），您会故意停止训练模型。
embedding
- 字词或文本片段的数值表示法。这些数字捕获了文本的语义含义和上下文。相似或相关的字词或文本往往具有类似的嵌入，这意味着它们在高维向量空间中彼此更靠近。
嵌入空间（潜在空间）
- 在生成式 AI 中，嵌入空间是指文本、图片或视频的数值表示形式，用于捕捉输入之间的关系。机器学习模型（尤其是生成式 AI 模型）擅长通过识别大型数据集中的模式来创建这些嵌入。应用可以利用嵌入来处理和生成语言，识别特定于内容的复杂含义和语义关系。
嵌入向量
- 一种密集（通常是低维）的内容项向量表示法，如果两个内容项在语义上相似，则它们的相应嵌入在嵌入向量空间中彼此接近。
编码器
- 一般来说，任何将原始、稀疏或外部表示形式转换为经过更多处理、更密集或更内部的表示形式的机器学习系统。编码器通常是较大模型的组成部分，并且经常与解码器配对使用。有些 Transformer 会将编码器与解码器配对，不过其他 Transformer 只使用编码器或只使用解码器。有些系统使用编码器的输出作为分类或回归网络的输入。在序列到序列任务中，编码器会接收输入序列并返回内部状态（一个向量）。然后，解码器使用该内部状态来预测下一个序列。
endpoint
- 可以将经过训练的模型部署到此类资源来提供推理服务。如需了解详情，请参阅选择端点类型。
集成学习
- 一组独立训练的模型，其推理结果经过平均处理或汇总。在许多情况下，集成模型比单个模型能做出更好的推理。例如，随机森林是由多个决策树构建的集成学习模型。请注意，并非所有决策森林都是集成学习模型。
环境
- 在强化学习中，包含智能体并允许智能体观察世界状态的世界。例如，所表示的世界可以是国际象棋等游戏，也可以是迷宫等现实世界。当智能体对环境应用某项操作时，环境会在状态之间转换。
评估
- 评估是一种实验，其中记录的或合成的查询会通过两个搜索堆栈发送：一个包含您所做的更改的实验堆栈，以及一个不包含您所做的更改的基准堆栈。评估会生成差异和指标，让您能够评估更改对搜索结果和 Google 用户体验的其他部分的影响、质量和其他影响。评估在对更改进行调整或迭代时使用。它们还用于对实时用户流量进行更改。
事件
- 事件描述了工件和执行之间的关系。每个工件可以由执行生成，并可供其他执行使用。事件将工件和执行链接在一起，以帮助您确定机器学习工作流中工件的来源。
执行
- 执行是单个机器学习工作流步骤的记录，通常带有其运行时参数注释。例如，执行可以是数据注入、数据验证、模型训练、模型评估和模型部署。
实验
- 实验是一个上下文，其中包含流水线运行作业以及一组 n 个实验运行作业，用户可以在其中集中调查不同的配置，如输入工件或超参数。
实验运行作业
- Vertex AI 实验中的特定可跟踪执行，用于记录输入（例如算法、参数和数据集）和输出（例如模型、检查点和指标），以监控和比较机器学习开发迭代。如需了解详情，请参阅创建和管理实验运行作业。
Explainable AI
- Vertex AI 的一项功能，可提供工具和功能来了解和解读机器学习模型做出的推理，从而深入了解特征重要性和模型行为。如需了解详情，请参阅 Vertex Explainable AI 简介。
探索性数据分析
- 在统计学中，探索性数据分析 (EDA) 是一种分析数据集的方法，用于汇总其主要特征（通常使用可视化方法）。并非必须使用统计模型，但 EDA 主要用于了解数据在正式建模或假设测试任务之外还可以告诉我们什么。
F1 得分
- F1 得分是一种用于评估模型输出准确性的指标。它对于评估模型在精确率和召回率都很重要的任务（例如信息提取）中的性能特别有用。对于生成式 AI 模型，可以使用 F1 得分将模型的推理结果与标准答案数据进行比较，以确定模型的准确性。不过，对于摘要和文本生成等生成式任务，Rough-L 得分等其他指标可能更适合。
特征
- 在机器学习 (ML) 中，特征是指实例或实体（用作训练机器学习模型或进行推理的输入）的特点或属性。
特征工程
- 特征工程是指将原始机器学习 (ML) 数据转换为可用于训练机器学习模型或进行推理的特征的过程。
特征组
- 特征组是指与包含特征数据的 BigQuery 源表或视图对应的特征注册表资源。特征视图可能包含特征，可视作数据源中特征列的逻辑分组。
特征记录
- 特征记录是所有特征值的聚合，用于描述特定时间点的唯一实体属性。
特征注册表
- 特征注册表是一个中央界面，用于记录您要用于在线推理的特征数据源。如需了解详情，请参阅特征注册表设置。
特征传送
- 特征传送是导出或提取存储特征值以用于训练或推理的过程。在 Vertex AI 中，有两种类型的特征传送：在线传送和离线传送。在线传送检索部分特征数据源的最新特征值来进行在线推理。离线或批量传送则是导出大量特征数据（包括历史数据）进行离线处理，例如机器学习模型训练。
特征时间戳
- 特征时间戳指示实体的特定特征记录中一组特征值的生成时间。
特征值
- 特征值对应于实例或实体的特征（属性）的实际可衡量值。唯一实体的特征值集合表示与该实体对应的特征记录。
特征视图
- 特征视图是从 BigQuery 数据源具体化为在线存储区实例的特征的逻辑集合。特征视图会存储并定期刷新客户的特征数据，这些数据会定期从 BigQuery 源刷新。特征视图通过与特征注册表资源关联来与特征数据存储空间关联或直接与其关联。
Filestore
- Google Cloud 提供的一项全托管式高性能文件存储服务，通常用于需要共享文件系统的应用。如需了解详情，请参阅 Filestore 概览。
基础模型 (FM)
- 基于广泛的数据进行训练，因此可以适应（例如，通过微调）各种下游任务的模型。
基础模型操作 (FMOPs)
- FMOps 扩展了 MLOps 的功能，专注于高效地将预训练（从头开始训练）或自定义（微调）的 FM 投入生产。
Google Cloud 流水线组件 SDK
- Google Cloud 流水线组件 (GCPC) SDK 提供了一组预构建的 Kubeflow Pipelines 组件，它们达到生产质量、具备高性能且易于使用。您可以使用 Google Cloud 流水线组件在 Vertex AI Pipelines 和其他符合 Kubeflow Pipelines 的机器学习流水线执行后端中定义和运行机器学习流水线。如需了解详情，请参阅 Google Cloud 流水线组件简介。
Compute Engine
- Compute Engine 是 Google Cloud Platform 的一个组件，也是一种基础设施即服务 (IaaS) 产品，可让用户在 Google 的基础设施上运行虚拟机。如需了解详情，请参阅 Compute Engine 概览。
Compute Engine 实例
- Compute Engine 实例是 Google 基础设施上运行的虚拟机 (VM)。您可以选择其规格、在其上运行应用，并通过互联网连接到它，但无需管理物理硬件。如需了解详情，请参阅适合任何工作负载的虚拟机。
Google 嵌入式调制解调器系统 (GEMS)
- GEMS 是一个面向调制解调器的嵌入式软件框架，以及随附的一组开发工作流和基础架构。GEMS 的核心愿景是提供高质量的调制解调器系统代码，并在包含调制解调器的许多 Google 设备中实现高可重用性。为了实现这一宏伟愿景，GEMS 为开发者提供了一个全面的环境，其中包含下文所述的主要组成块。
梯度
- 偏导数相对于所有自变量的向量。在机器学习中，梯度是模型函数偏导数的向量。梯度指向最高速上升的方向。
图表
- 在 Vertex AI 的上下文中，图是指表示实体及其属性之间的关系的数据结构。它用于对知识图谱、社交网络和业务流程等复杂数据进行建模和分析。如需了解详情，请参阅 Vertex ML Metadata 简介。
标准答案 (GT)
- 标准答案是一个术语，在各个领域中用于指代某个决策或测量问题的绝对事实，而不是某个系统的估计值。在机器学习中，“标准答案”一词是指监督式学习技术的训练集。
启发法
- 一种简单且快速实现的解决问题的解决方案。例如，“采用启发法，我们实现了 86% 准确率。当我们改为使用深度神经网络时，准确率上升到 98%。”
隐藏层
- 神经网络中介于输入层（特征）和输出层（推理）之间的层。每个隐藏层都包含一个或多个神经元。深度神经网络包含多个隐藏层。
直方图
- 使用柱状图以图形方式显示一组数据中的变化。直方图直观呈现了在简单数字表中难以检测到的模式。
超参数
- 超参数是指管理机器学习模型训练过程的变量。这些变量可以包括学习速率、优化器中的动量值以及模型最后一个隐藏层中的单元数。如需了解详情，请参阅超参数调优概览。
超参数调优
- Vertex AI 中的超参数调优涉及使用所选超参数的不同值（设置在指定限制范围内）运行训练应用的多次试验。目标是优化超参数设置，以最大限度地提高模型的预测准确率。如需了解详情，请参阅超参数调优概览。
Identity and Access Management 权限 (IAM)
- Identity and Access Management (IAM) 权限是特定的精细功能，用于定义谁可以在哪些 Google Cloud 资源上执行哪些操作。它们通过角色分配给主账号（例如用户、群组或服务账号），从而可以精确控制对 Google Cloud 项目或组织内服务和数据的访问权限。如需了解详情，请参阅使用 IAM 进行访问权限控制。
图像识别
- 图像识别是指对图像中的对象、图案或概念进行分类的过程。也称为图像分类。图像识别是机器学习和计算机视觉的一个子领域。
索引
- 为相似度搜索而部署的一组向量。可以在索引中添加或移除向量。相似度搜索查询会被发送到特定索引，并将搜索该索引中的向量。
推理
- 在 Vertex AI 平台环境中，推理是指通过机器学习模型运行数据点来计算输出（例如单个数值得分）的过程。此过程也称为“将机器学习模型付诸使用”或“将机器学习模型投入生产”。推理是机器学习工作流中的重要步骤，因为它可以让模型用于对新数据进行推理。在 Vertex AI 中，您可以通过多种方式执行推理，包括批量推理和在线推理。批量推理涉及运行一组推理请求并将结果输出到一个文件中，而在线推理则允许对单个数据点进行实时推理。
信息检索 (IR)
- 信息检索 (IR) 是 Vertex AI Search 的一个关键组成部分。它是指从大量数据中查找和检索相关信息的过程。在 Vertex AI 的上下文中，IR 用于根据用户的查询从语料库中检索文档。Vertex AI 提供了一套 API，可帮助您构建自己的检索增强生成 (RAG) 应用或构建自己的搜索引擎。如需了解详情，请参阅使用 RAG Engine 将 Vertex AI Search 用作检索后端。
基础设施即代码 (IaC)
- 基础设施即代码。一种管理 IT 基础设施的方法，团队可以通过代码管理和预配服务。借助 IaC，您可以创建包含基础设施规范的配置文件，从而更轻松地大规模创建和修改基础设施。
基础设施即代码 (IaC)
- 基础设施即代码。一种管理 IT 基础设施的方法，团队可以通过代码管理和预配服务。借助 IaC，您可以创建包含基础设施规范的配置文件，从而更轻松地大规模创建和修改基础设施。
IP 地址耗尽
- 当指定范围内的可用 IP 地址耗尽时，就会发生 IP 地址耗尽。如需了解详情，请参阅 Cloud Run 网络最佳实践。
位置
- 位置是指托管云资源的物理位置。此概念分为两个主要部分：区域和可用区。如需了解详情，请参阅区域和可用区。
损失（代价）
- 在监督式模型的训练期间，用于衡量模型的推理结果与标签之间的差距。损失函数用于计算损失。
机器学习元数据
- ML Metadata (MLMD) 是一个库，用于记录和检索与机器学习开发者和数据科学家工作流相关的元数据。虽然 MLMD 是 TensorFlow Extended (TFX) 不可或缺的一部分，但它也可以独立使用。作为更为广泛的 TFX 平台的一部分，大多数用户仅在检查流水线组件的结果时与 MLMD 交互，例如在笔记本中或 TensorBoard 中。
代管式数据集
- 由 Vertex AI 创建和托管的数据集对象。
手动记录
- 在训练脚本中显式添加代码（例如，使用 Python 版 Vertex AI SDK）以跟踪自定义参数、指标和制品并将其记录到 Vertex AI Experiments 运行中的过程。如需了解详情，请参阅监控和日志记录概览。
Managed Lustre
- 一种专为高性能计算设计的并行分布式文件系统。Google Cloud 的 Managed Lustre 为要求苛刻的工作负载提供高吞吐量文件系统。如需了解详情，请参阅 Managed Lustre 概览。
手动扩缩
- 手动伸缩是指用户或管理员明确且有意地调整分配给应用或服务的计算资源（例如虚拟机、容器或服务器）数量的过程。与根据需求自动调整资源的自动伸缩不同，手动伸缩需要直接干预才能配置或取消配置资源，虽然可以实现精确控制，但缺乏自动化解决方案的动态响应能力。如需了解详情，请参阅扩缩 Veo on Vertex AI 集群：手动扩缩。
手动扩缩
- 手动伸缩是指用户或管理员明确且有意地调整分配给应用或服务的计算资源（例如虚拟机、容器或服务器）数量的过程。与根据需求自动调整资源的自动伸缩不同，手动伸缩需要直接干预才能配置或取消配置资源，虽然可以实现精确控制，但缺乏自动化解决方案的动态响应能力。如需了解详情，请参阅扩缩 Veo on Vertex AI 集群：手动扩缩。
最大传输单元 (MTU)
- 网络连接设备可传输的最大数据包大小。较大的 MTU 大小（巨型帧）可以提高某些工作负载的网络性能。如需了解详情，请参阅最大传输单元。
MetadataSchema
- MetadataSchema 描述特定类型的工件、执行或上下文的架构。MetadataSchema 用于在创建元数据资源期间验证相应的键值对。系统仅对资源和 MetadataSchema 之间的匹配字段执行架构验证。类型架构使用 OpenAPI 架构对象来表示，该对象使用 YAML 进行描述。
MetadataStore
- MetadataStore 是元数据资源的顶级容器。MetadataStore 分区域并与特定 Google Cloud 项目关联。通常，组织会为每个项目中的元数据资源使用一个共享 MetadataStore。
机器学习流水线
- 机器学习流水线是基于容器的便携式和可扩缩的机器学习工作流。
模型
- 任何模型，无论是否经过预训练。一般来说，任何处理输入数据并返回输出的数学结构。换句话说，模型是系统进行推理所需的一组参数和结构。
模型蒸馏（知识蒸馏、教师-学生模型）
- 模型蒸馏是一种技术，可让较小的学生模型向较大的教师模型学习。学生模型经过训练后可以模仿教师模型的输出，然后可用于生成新数据或进行推理。模型蒸馏通常用于提高大型模型的效率，或使资源有限的设备能够更轻松地使用这些模型。它还可以通过减少过拟合来提高模型的泛化能力。
模型评估
- Vertex AI Model Evaluation 是 Google Cloud 的 Vertex AI 平台中的一项代管式服务，可帮助用户评估其机器学习模型的性能和质量。它提供可生成各种评估指标和可视化的工具，让用户能够了解模型的性能表现、识别潜在的偏见，并就模型部署和改进做出明智的决策。如需了解详情，请参阅 Vertex AI 中的模型评估。
模型监控
- Vertex AI Model Monitoring 是一项服务，可通过检测预测请求中的特征偏差和偏移来持续评估已部署模型的性能，从而帮助您长期保持模型质量。如需了解详情，请参阅 Vertex AI Model Monitoring 简介。
模型资源名称
- model 的资源名称格式如下：projects/<PROJECT_ID>/locations/<LOCATION_ID>/models/<MODEL_ID>。您可以在 Cloud 控制台中的 Model Registry 页面上找到模型的 ID。
网络文件系统 (NFS)
- 一种客户端/服务器系统，可让用户通过网络访问文件，并像处理本地文件目录中的文件一样处理这些文件。如需了解详情，请参阅装载 NFS 共享以进行自定义训练。
NVIDIA Collective Communications Library (NCCL)
- 一个为深度学习框架提供优化的 GPU 间通信原语的库，可实现高性能多 GPU 训练。如需了解详情，请参阅 NVIDIA Collective Communications Library (NCCL)。
离线存储区
- 离线存储区是存储近期和历史特征数据的存储设施，通常用于训练机器学习模型。离线存储区还包含最新的特征值，可用于在线推理。
在线推理
- 同步获取对个别实例的推理结果。如需了解详情，请参阅在线推理。
在线预测
- 同步获取单个实例的预测结果。如需了解详情，请参阅在线预测。
在线存储区
- 在特征管理中，在线存储区是存储用于在线推理的最新特征值的存储设施。
参数
- 参数是键入的输入值，它们可配置运行作业，控制运行作业的行为，并影响运行作业的结果。例如学习速率、漏失率和训练步数。
永久性资源
- 一种 Vertex AI 计算资源（例如 Ray 集群），在明确删除之前会一直处于分配状态并保持可用，这有利于迭代开发，并可减少作业之间的启动开销。如需了解详情，请参阅获取永久性资源信息。
管道
- 机器学习流水线是基于容器的便携式和可扩缩的机器学习工作流。如需了解详情，请参阅 Vertex AI Pipelines 简介。
流水线组件
- 一组独立的代码，用于在流水线工作流中执行一个步骤，例如数据预处理、数据转换和模型训练。
流水线作业
- 流水线作业或流水线运行对应于 Vertex AI API 中的 PipelineJob 资源。它是机器学习流水线定义的执行实例，定义为一组通过输入输出依赖项相互关联的机器学习任务。
流水线运行作业
- 一个实验可以关联一个或多个 Vertex PipelineJob，其中每个 PipelineJob 均表示为一个单独的运行作业。在此上下文中，运行作业的参数由 PipelineJob 的参数推断。指标从该 PipelineJob 生成的 system.Metric 工件推断。运行作业的工件从该 PipelineJob 生成的工件推断。
流水线模板
- 单个或多个用户可以重复使用机器学习工作流定义来创建多个流水线运行。
正类别
- “正类别”是指模型经过训练以预测的结果或类别。例如，如果模型要预测客户是否会购买夹克，正类别就是“客户购买夹克”。同样，在预测客户是否注册定期存款的模型中，正类别将是“客户已注册”。与之相反的是“负类别”。
预构建容器
- Vertex AI 提供的容器映像，预安装了常见的机器学习框架及依赖项，可简化训练和推理作业的设置过程。如需了解详情，请参阅用于自定义训练的预构建容器。
专用 Google 访问通道 (PGA)
- 借助专用 Google 访问通道，那些只具有内部（专用）IP 地址（无外部 IP 地址）的虚拟机实例将能够访问 Google API 和服务的公共 IP 地址。如需了解详情，请参阅配置专用 Google 访问通道。
专用服务访问通道
- 专用服务访问通道是一种专用连接，将您的虚拟私有云 (VPC) 网络与 Google 或第三方服务提供商拥有的网络连接起来。这样便可以使用内部 IP 地址在您的 VPC 网络中的虚拟机 (VM) 实例与这些服务进行通信，避免暴露到公共互联网。如需了解详情，请参阅专用服务访问通道。
Private Service Connect (PSC)
- Private Service Connect 是一项技术，可让 Compute Engine 客户将其网络中的专用 IP 映射到另一个 VPC 网络或 Google API。如需了解详情，请参阅 Private Service Connect。
Private Service Connect 接口 (PSC-I)
- Private Service Connect 接口可让提供方以私密方式发起与使用方 VPC 中任何网络资源的连接。
生产者 VPC
- 提供方 VPC 是一个虚拟私有云 (VPC) 网络，用于托管代管式服务并将其提供给其他 VPC 网络。
量化
- 量化是一种模型优化技术，用于降低用于表示模型参数的数字的精度。这可以缩小模型大小、降低功耗和缩短推理延迟时间。
随机森林
- 随机森林是一种机器学习算法，可用于分类和回归。它本身并不是生成式 AI 模型，但可以在更大的生成式 AI 系统中使用。随机森林由多个决策树组成，其推理结果是这些单个树的推理结果的汇总。例如，在分类任务中，每棵树都会“投票”选择一个类别，而最终推理结果是获得票数最多的类别。如需了解详情，请参阅决策森林。
Ray 客户端 API (Ray Client)
- Ray 客户端是一种 API，可让本地 Python 脚本或交互式 shell（例如 Jupyter 笔记本）连接到远程 Ray 集群并与之互动。从本质上讲，Ray 客户端使用户能够开发和执行 Ray 代码，就像代码在本地运行一样，同时实际利用远程集群的分布式计算能力。如需了解详情，请参阅 Ray on Vertex AI 概览。
Ray on Vertex AI 集群
- Ray on Vertex AI 集群是一个由计算节点组成的托管式集群，可用于运行分布式机器学习 (ML) 和 Python 应用。它提供了用于为机器学习工作流执行分布式计算和并行处理的基础设施。Vertex AI 中内置的 Ray 集群可确保关键机器学习工作负载或高峰季的容量可用性。与自定义作业（训练服务在作业完成后会释放资源）不同，Ray 集群在删除之前会一直可用。如需了解详情，请参阅 Ray on Vertex AI 概览。
Ray on Vertex AI (RoV)
- Ray on Vertex AI 旨在让您能够使用相同的开源 Ray 代码在 Vertex AI 上编写程序和开发应用，并且只需极少的更改。如需了解详情，请参阅 Ray on Vertex AI 概览。
Ray on Vertex AI SDK for Python
- Ray on Vertex AI SDK for Python 是 Vertex AI SDK for Python 的一个版本，其中包含 Ray 客户端、Ray BigQuery 连接器、Vertex AI 上的 Ray 集群管理和 Vertex AI 上的推理功能。如需了解详情，请参阅 Vertex AI SDK for Python 简介。
recall
- 索引返回的真正最近邻的百分比。例如，如果一个对 20 个最近邻的最近邻查询返回 19 个“标准答案”最近项，则召回率为 19/20x100 = 95%。
缩减服务器
- Reduction Server 是 Vertex AI 中提供的一项功能或组件，专门用于优化分布式 GPU 训练。Reduction Server 是一种全缩减算法，有助于提高大规模机器学习模型训练的吞吐量并减少延迟时间。如需了解详情，请参阅使用 Reduction Server 缩短训练时间。
正则化
- 正则化是一种用于防止机器学习模型出现过拟合的技术。当模型过于精确地学习训练数据时，就会出现过拟合，导致模型在未见过的数据上表现不佳。其中一种提到的正则化类型是早停法，即在验证数据集上的损失开始增加之前停止训练，这表明泛化性能下降。如需了解详情，请参阅过拟合：L2 正则化。
强化学习 (RL)
- 一种机器学习类型，其中智能体通过在环境中采取行动来学习如何做出决策，以最大限度地提高累积奖励。如需了解详情，请参阅使用 Vertex AI 进行 RLHF 调优。
限制
- 使用布尔值规则将搜索“限制”为一部分索引的功能。限制也称为“过滤”。借助 Vector Search，您可以使用数字过滤和文本属性过滤。
服务账号
- 服务账号是一种特殊的 Google Cloud 账号，应用或虚拟机可以使用此类账号对 Google Cloud 服务执行已获授权的 API 调用。与用户账号不同，服务账号不与个人相关联，而是充当代码的身份，从而实现对资源安全且程序化的访问，且无需人工凭证。如需了解详情，请参阅服务账号概览。
服务代理
- 服务智能体是指由 Google 托管式服务账号。当某项服务需要访问由其他服务创建的资源时，就会使用此权限。例如，当 Dataflow 或 Dataproc 服务需要在运行时创建实例，或者 Cloud Functions 想要使用密钥管理服务 (KMS) 来保护 Cloud Functions 时。当服务需要服务代理时，Google Cloud 会自动创建服务代理。它们通常用于管理对资源的访问权限，并代表服务执行各种任务。如需了解详情，请参阅服务代理。
Simple Linux Utility for Resource Management (SLURM)
- Slurm 是一款开源、强大且广泛使用的工作负载管理器和作业调度器，适用于 Linux 和类 Unix 内核，尤其是在高性能计算 (HPC) 环境中。如需了解详情，请参阅 Slurm 工作负载管理器。
摘要指标
- 摘要指标是实验运行作业中每个指标键的单一值。例如，实验的测试准确率是在训练结束时根据测试数据集计算得出的，可以作为单一值摘要指标捕获。
监督式微调 (SFT)
- 一种机器学习技术，即在预训练模型的基础上，使用较小的带标签数据集进一步训练模型，使其适应特定任务。
TensorBoard
- TensorBoard 是一套用于直观呈现和解读 TensorFlow 运行作业和模型的 Web 应用。如需了解详情，请参阅 TensorBoard。
TensorBoard 实例
- TensorBoard 实例是区域化资源，用于存储与项目关联的 Vertex AI TensorBoard 实验。例如，如果您需要多个启用 CMEK 的实例，则可以在项目中创建多个 TensorBoard 实例。这与 API 中的 TensorBoard 资源相同。
TensorBoard 资源名称
- TensorBoard 资源名称用于完全标识 Vertex AI TensorBoard 实例。格式如下：projects/PROJECT_ID_OR_NUMBER/locations/REGION/tensorboards/TENSORBOARD_INSTANCE_ID。
TensorFlow Extended (TFX)
- TensorFlow Extended (TFX) 是一个基于 TensorFlow 平台部署生产机器学习流水线的端到端平台。
TensorFlow Serving 容器
- 一种专门设计的容器映像，用于高效地提供 TensorFlow 模型以进行推理，在部署使用 Vertex AI Model Monitoring 的自定义表格模型时使用。
时间偏移值
- 时间偏移值是相对于视频开头进行计算的。
时间段
- 时间段由开始时间和结束时间偏移值来标识。
时序指标
- 时序指标是纵向指标值，其中每个值表示运行作业的训练例程部分中的一步。时序指标存储在 Vertex AI TensorBoard 中。Vertex AI Experiments 存储对 Vertex TensorBoard 资源的引用。
token
- 语言模型中的词元是模型训练和进行推理的原子单元，即字词、语素和字符。在语言模型之外的网域中，词元可以表示其他类型的原子单元。例如，在计算机视觉中，词元可能是图片的一部分。如需了解详情，请参阅列出和统计 token 数。
训练集群
- 训练集群是一组互连的计算资源（如虚拟机、GPU 和关联的存储空间），专门配置用于以分布式方式执行机器学习模型训练工作负载。这些集群旨在提供高效训练复杂模型所需的计算能力和可伸缩性，通常会利用多个节点上的并行处理。如需了解详情，请参阅训练集群的结构。
训练集
- 在 Vertex AI 中，训练集是用于训练机器学习模型的数据中占比最大的部分（通常为 80%）。模型会学习这些数据中的模式和关系，以便进行推理。训练集不同于验证集和测试集，后者用于在训练期间和训练后评估模型的性能。
轨迹
- “轨迹”是指智能体或模型采取的一系列步骤或操作。它通常用于评估生成模型，以评估模型生成文本、代码或其他内容的能力。有多种轨迹指标可用于评估生成模型，包括轨迹完全匹配、轨迹按顺序匹配、轨迹任意顺序匹配和轨迹精确度。这些指标用于衡量模型输出与一组人工生成的参考输出之间的相似度。
Transformer
- “Transformer”是一种神经网络架构，是大多数先进生成模型的基础。它可用于各种语言模型应用，包括翻译。Transformer 由编码器和解码器组成；编码器会将输入文本转换为中间表示形式，解码器会将其转换为有用的输出。它们利用自注意力机制从要处理的字词周围的字词中收集上下文。虽然训练 Transformer 需要大量资源，但针对特定应用对预训练的 Transformer 进行微调会更高效。
真正例
- “真正例”是指模型正确识别出正类别的推理。例如，如果模型经过训练，可以识别出哪些客户会购买夹克，那么真正例就是正确预测出某位客户会购买夹克。
非代管式工件
- 位于 Vertex AI 上下文之外的工件。
vector
- 向量是指文本、图片或视频的数值表示法，用于捕捉输入之间的关系。机器学习模型适用于通过识别大型数据集中的模式来创建嵌入。应用可以使用嵌入来处理和生成语言，识别特定于内容的复杂含义和语义关系。如需了解详情，请参阅嵌入 API 概览。
Vertex AI Agent Engine
- Vertex AI Agent Engine 是 Vertex AI Platform 的一部分，是一组可让开发者在生产环境中部署、管理和扩缩 AI 智能体的服务。Agent Engine 负责处理基础设施，使智能体在生产环境中能够自动伸缩，因此您可以专注于创建应用。如需了解详情，请参阅 Vertex AI Agent Engine 概览。
Vertex AI 数据类型
- Vertex AI 数据类型有“图片”“文本”“表格”和“视频”。
Vertex AI Experiments
- 借助 Vertex AI Experiments，用户可以跟踪以下内容：1. 实验运行作业的步骤（例如预处理和训练）。2. 输入（例如算法、参数和数据集）。3. 这些步骤的输出（例如模型、检查点和指标）。
Vertex AI Feature Store
- 一项用于存储、提供和管理机器学习特征的代管式服务。如需了解详情，请参阅关于 Vertex AI Feature Store。
Vertex AI Inference
- 一项 Vertex AI 服务，可让您使用经过训练的机器学习 (ML) 模型从未见过的新数据中进行推理。Vertex AI 提供用于部署模型以进行推理的服务。如需了解详情，请参阅从自定义训练模型获取推理结果。
Vertex ML Metadata
- 一种用于跟踪和分析机器学习工作流中的元数据的系统。如需了解详情，请参阅 Vertex ML Metadata 简介。
Vertex AI Model Registry
- Vertex AI Model Registry 是一个中央代码库，您可以在其中管理机器学习模型的生命周期。借助 Vertex AI Model Registry，您可以大致了解模型，以便更好地组织、跟踪和训练新版本。如果您想要部署模型版本，可以直接从存储库将其分配给端点，也可以使用别名将模型部署到端点。如需了解详情，请参阅 Vertex AI Model Registry 简介。
Vertex AI SDK for Python
- Vertex AI SDK for Python 提供与 Vertex AI Python 客户端库类似的功能，但 SDK 级别更高且更精细。
Vertex AI TensorBoard
- Vertex AI TensorBoard 是 Google Cloud 上的一项可伸缩的托管式服务，可让数据科学家和机器学习工程师使用熟悉的开源 TensorBoard 界面直观呈现机器学习实验、调试模型训练并跟踪性能指标。它可与 Vertex AI Training 和其他服务无缝集成，为实验数据提供持久性存储，并支持对模型开发进行协作分析。如需了解详情，请参阅 Vertex AI TensorBoard 简介。
Vertex AI Vizier
- 一种用于调节超参数和其他参数的黑盒优化服务。如需了解详情，请参阅 Vertex AI Vizier 概览。
Vertex AI Workbench
- Vertex AI Workbench 是一个基于 Jupyter 笔记本的统一开发环境，支持整个数据科学工作流，从数据探索和分析到模型开发、训练及部署。Vertex AI Workbench 提供可扩缩的托管式基础架构，并内置了与其他 Google Cloud 服务（如 BigQuery 和 Cloud Storage）的集成，使数据科学家能够高效地执行机器学习任务，而无需管理底层基础架构。如需了解详情，请参阅 Vertex AI Workbench 简介。
视频片段
- 视频片段由视频的开始时间和结束时间偏移值来标识。
虚拟机 (VM)
- 虚拟机 (VM) 是完全在软件中模拟的完整计算机系统。它作为独立的“客户机”在物理“宿主机”上运行。如需了解详情，请参阅 Compute Engine 实例。
Virtual Private Cloud (VPC)
- 托管在公有云中的安全隔离专用云，可让您定义在逻辑上与 Google Cloud 中的其他虚拟网络隔离的虚拟网络。如需了解详情，请参阅 Virtual Private Cloud。
VPC Service Controls
- VPC Service Controls 是 Google Cloud 中的一项安全功能，可让组织围绕其敏感数据和资源创建安全边界，从而降低数据渗漏风险。VPC Service Controls 通过限制从未经授权的网络访问指定的 Google Cloud 服务和数据，并防止数据移出这些已定义的边界来实现此目的，从而为防范内部威胁和意外数据泄露提供强有力的保护。如需了解详情，请参阅 VPC Service Controls。
工作器节点
- 工作器节点是指集群内负责执行任务或执行工作的各个机器或计算实例。在 Kubernetes 或 Ray 集群等系统中，节点是基本的计算单元。
工作器池
- Ray 集群中执行分布式任务的组件。工作器池可以配置为使用特定机器类型，并且支持自动扩缩和手动扩缩。如需了解详情，请参阅训练集群的结构。

如未另行说明，那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可，并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情，请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。

最后更新时间 (UTC)：2025-10-19。