日志和指标

本文档介绍了 Gemini on Google Distributed Cloud Connected API 收集和导出的日志和指标。

配置日志记录和监控

您必须先执行以下操作,然后才能开始收集日志和指标:

  1. 使用以下命令启用日志记录 API:

    gcloud services enable opsconfigmonitoring.googleapis.com --project PROJECT_ID
    gcloud services enable logging.googleapis.com --project PROJECT_ID
    gcloud services enable monitoring.googleapis.com --project PROJECT_ID
    

    PROJECT_ID 替换为目标 Google Cloud 项目的 ID。

  2. 授予写入日志和指标所需的角色:

    gcloud projects add-iam-policy-binding PROJECT_ID \
        --role roles/opsconfigmonitoring.resourceMetadata.writer \
        --member "serviceAccount:PROJECT_ID.svc.id.goog[kube-system/metadata-agent]"
    
    gcloud projects add-iam-policy-binding PROJECT_ID \
        --role roles/logging.logWriter \
         --member "serviceAccount:PROJECT_ID.svc.id.goog[kube-system/stackdriver-log-forwarder]"
    
    gcloud projects add-iam-policy-binding PROJECT_ID \
        --role roles/monitoring.metricWriter \
        --member "serviceAccount:PROJECT_ID.svc.id.goog[kube-system/gke-metrics-agent]"
    

    PROJECT_ID 替换为目标 Google Cloud 项目的 ID。

日志

本部分列出了 Gemini on GDC connected API 支持的 Cloud Logging 资源类型。如需查看 Gemini on GDC connected API 日志,请使用 Google Cloud 控制台中的日志浏览器。Gemini on GDC connected API} 日志记录始终处于启用状态。

Gemini on GDC 已连接的 API 已连接的已记录资源类型为 aiplatform.googleapis.com/Endpoint

您还可以使用 Cloud Logging API 捕获和检索 Gemini on GDC 连接的 API 连接日志。如需了解如何配置此日志记录机制,请参阅 Cloud Logging 客户端库的相关文档。

指标

本部分列出了 Gemini on GDC Connected API 支持的 Cloud Monitoring 指标。如需查看 Gemini on GDC connected API 指标,请使用Google Cloud 控制台中的 Metrics Explorer

Distributed Cloud Connected 集群指标

GDC Connected 上的 Gemini API 端点部署在 Distributed Cloud Connected 集群上。如需了解 Distributed Cloud Connected 的日志和指标,请参阅日志和指标

推理网关指标

Prometheus 指标名称 指标类型 数据类型 标签 化学家类型 Chemist metric_kind Chemist value_type 药剂师标签
ig_ops_successful_incoming_requests 计数器 模型 aiplatform.googleapis.com/prediction/internal/gdc/ig/successful_requests 累计 INT64 模型
ig_ops_unique_users 计数器 模型 aiplatform.googleapis.com/prediction/internal/gdc/ig/unique_users 累计 INT64 模型
ig_tokens_per_minute 直方图 双精度 模型 aiplatform.googleapis.com/prediction/internal/gdc/ig/tokens_per_min 累计 DISTRIBUTION 模型
ig_total_response_time 直方图 双精度 模型 aiplatform.googleapis.com/prediction/internal/gdc/ig/response_time 累计 DISTRIBUTION 模型
ig_ops_ffmpeg_image_latency 直方图 双精度 模型 aiplatform.googleapis.com/prediction/internal/gdc/ig/ffmpeg_image_latencies 累计 DISTRIBUTION 模型
ig_ops_ffmpeg_video_latency 直方图 双精度 模型 aiplatform.googleapis.com/prediction/internal/gdc/ig/ffmpeg_video_latencies 累计 DISTRIBUTION 模型
ig_ops_ffmpeg_audio_latency 直方图 双精度 模型 aiplatform.googleapis.com/prediction/internal/gdc/ig/ffmpeg_audio_latencies 累计 DISTRIBUTION 模型
ig_time_to_first_token 直方图 双精度 模型上下文窗口 aiplatform.googleapis.com/prediction/internal/gdc/ig/ttft 累计 DISTRIBUTION 模型上下文窗口
ig_time_per_output_token 直方图 双精度 模型上下文窗口 aiplatform.googleapis.com/prediction/internal/gdc/ig/tpot 累计 DISTRIBUTION 模型上下文窗口
ig_cache_hit 计数器 模型 aiplatform.googleapis.com/prediction/internal/gdc/ig/cache_hit_count 累计 DISTRIBUTION model _gdch_project
ig_cache_miss 计数器 模型 aiplatform.googleapis.com/prediction/internal/gdc/ig/cache_miss_count 累计 DISTRIBUTION model _gdch_project

GenAI 路由器指标

Prometheus 指标名称 指标类型 数据类型 标签 化学家类型 Chemist metric_kind Chemist value_type 药剂师标签
llm_total_request_latency_milliseconds 直方图 双精度 context_window 模型 aiplatform.googleapis.com/prediction/internal/gdc/gair/total_request_latencies 累计 DISTRIBUTION context_window 模型
llm_unary_request_latency_milliseconds 直方图 双精度 context_window 模型 aiplatform.googleapis.com/prediction/internal/gdc/gair/unary_request_latencies 累计 DISTRIBUTION context_window 模型
llm_streaming_ttft_milliseconds 直方图 双精度 context_window 模型 aiplatform.googleapis.com/prediction/internal/gdc/gair/ttft_ms 累计 DISTRIBUTION context_window 模型
llm_streaming_tpot_milliseconds 直方图 双精度 context_window 模型 aiplatform.googleapis.com/prediction/internal/gdc/gair/tpot_ms 累计 DISTRIBUTION context_window 模型
llm_input_token_count 直方图 双精度 模型 aiplatform.googleapis.com/prediction/internal/gdc/gair/input_token_count 累计 DISTRIBUTION 模型
llm_output_token_count 直方图 双精度 模型 aiplatform.googleapis.com/prediction/internal/gdc/gair/output_token_count 累计 DISTRIBUTION 模型
llm_success_response_count 计数器 双精度 模型 aiplatform.googleapis.com/prediction/internal/gdc/gair/success_response_count 累计 INT64 模型
llm_failure_response_count 计数器 双精度 模型 aiplatform.googleapis.com/prediction/internal/gdc/gair/failure_response_count 累计 INT64 模型
llm_text_tokenization_latency_milliseconds 直方图 双精度 模型 aiplatform.googleapis.com/prediction/internal/gdc/gair/text_tokenization_latencies 累计 DISTRIBUTION 模型
llm_image_tokenization_latency_milliseconds 直方图 双精度 aiplatform.googleapis.com/prediction/internal/gdc/gair/image_tokenization_latencies 累计 DISTRIBUTION
llm_audio_tokenization_latency_milliseconds 直方图 双精度 aiplatform.googleapis.com/prediction/internal/gdc/gair/audio_tokenization_latencies 累计 DISTRIBUTION

GPU 指标

Prometheus 指标名称 指标类型 数据类型 标签 化学家类型 Chemist metric_kind Chemist value_type 药剂师标签
DCGM_FI_DEV_MEM_COPY_UTIL 仪表盘 int64 gpu UUID pci_bus_id 设备 modelName 主机名 DCGM_FI_DRIVER_VERSION aiplatform.googleapis.com/prediction/internal/gdc/gpu/memory_util 仪表盘 INT64 uuid gpu_model
DCGM_FI_DEV_MEMORY_TEMP 仪表盘 int64 同上 aiplatform.googleapis.com/prediction/internal/gdc/gpu/memory_temp 仪表盘 INT64 同上
DCGM_FI_DEV_POWER_USAGE 仪表盘 双精度 同上 aiplatform.googleapis.com/prediction/internal/gdc/gpu/power_usage 仪表盘 DOUBLE 同上
DCGM_FI_DEV_GPU_TEMP 仪表盘 双精度 同上 aiplatform.googleapis.com/prediction/internal/gdc/gpu/gpu_temp 仪表盘 INT64 同上
DCGM_FI_DEV_GPU_UTIL 仪表盘 双精度 同上 aiplatform.googleapis.com/prediction/internal/gdc/gpu/gpu_util 仪表盘 INT64 同上
DCGM_FI_DEV_ENC_UTIL 仪表盘 int64 同上 aiplatform.googleapis.com/prediction/internal/gdc/gpu/encode_util 仪表盘 INT64 同上
DCGM_FI_DEV_XID_ERRORS 计数器 int64 同上 aiplatform.googleapis.com/prediction/internal/gdc/gpu/xid_errors 累计 INT64 同上
DCGM_FI_DEV_POWER_VIOLATION 计数器 int64 同上 aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_power 累计 INT64 同上
DCGM_FI_DEV_THERMAL_VIOLATION 计数器 int64 同上 aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_thermal 累计 INT64 同上
DCGM_FI_DEV_SYNC_BOOST_VIOLATION 计数器 int64 同上 aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_sync_boost 累计 INT64 同上
DCGM_FI_DEV_BOARD_LIMIT_VIOLATION 计数器 int64 同上 aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_board_limit 累计 INT64 同上
DCGM_FI_DEV_LOW_UTIL_VIOLATION 计数器 int64 同上 aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_low_util 累计 INT64 同上
DCGM_FI_DEV_RELIABILITY_VIOLATION 计数器 int64 同上 aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_reliability 累计 INT64 同上