このドキュメントでは、Gemini on Google Distributed Cloud connected API が収集してエクスポートするログと指標について説明します。
ロギングとモニタリングの構成
ログと指標の収集を開始する前に、次の操作を行う必要があります。
次のコマンドを使用して、ロギング API を有効にします。
gcloud services enable opsconfigmonitoring.googleapis.com --project PROJECT_ID gcloud services enable logging.googleapis.com --project PROJECT_ID gcloud services enable monitoring.googleapis.com --project PROJECT_ID
PROJECT_ID
は、ターゲット Google Cloud プロジェクトの ID に置き換えます。ログと指標の書き込みに必要なロールを付与します。
gcloud projects add-iam-policy-binding PROJECT_ID \ --role roles/opsconfigmonitoring.resourceMetadata.writer \ --member "serviceAccount:PROJECT_ID.svc.id.goog[kube-system/metadata-agent]" gcloud projects add-iam-policy-binding PROJECT_ID \ --role roles/logging.logWriter \ --member "serviceAccount:PROJECT_ID.svc.id.goog[kube-system/stackdriver-log-forwarder]" gcloud projects add-iam-policy-binding PROJECT_ID \ --role roles/monitoring.metricWriter \ --member "serviceAccount:PROJECT_ID.svc.id.goog[kube-system/gke-metrics-agent]"
PROJECT_ID
は、ターゲット Google Cloud プロジェクトの ID に置き換えます。
ログ
このセクションでは、Gemini on GDC connected API でサポートされている Cloud Logging リソースタイプの一覧を示します。Gemini on GDC 接続 API ログを表示するには、 Google Cloud コンソールのログ エクスプローラを使用します。Gemini on GDC connected API} ロギングは常に有効です。
Gemini on GDC 接続 API 接続ログのリソースタイプは aiplatform.googleapis.com/Endpoint
です。
Cloud Logging API を使用して、Gemini on GDC 接続 API 接続ログをキャプチャして取得することもできます。このロギング メカニズムの構成方法については、Cloud Logging クライアント ライブラリのドキュメントをご覧ください。
指標
このセクションでは、Gemini on GDC 接続 API でサポートされている Cloud Monitoring 指標を示します。Gemini on GDC 接続 API 指標を表示するには、Google Cloud コンソールの Metrics Explorer を使用します。
Distributed Cloud コネクテッド クラスタの指標
Gemini on GDC connected API エンドポイントは、Distributed Cloud connected クラスタにデプロイされます。Distributed Cloud Connected のログと指標については、ログと指標をご覧ください。
推論 Gateway の指標
Prometheus 指標名 | 指標タイプ | Datatype | ラベル | 化学物質の種類 | Chemist metric_kind | Chemist の value_type | 薬剤師ラベル |
---|---|---|---|---|---|---|---|
ig_ops_successful_incoming_requests | カウンタ | モデル | aiplatform.googleapis.com/prediction/internal/gdc/ig/successful_requests | CUMULATIVE | INT64 | モデル | |
ig_ops_unique_users | カウンタ | モデル | aiplatform.googleapis.com/prediction/internal/gdc/ig/unique_users | CUMULATIVE | INT64 | モデル | |
ig_tokens_per_minute | ヒストグラム | double | モデル | aiplatform.googleapis.com/prediction/internal/gdc/ig/tokens_per_min | CUMULATIVE | DISTRIBUTION | モデル |
ig_total_response_time | ヒストグラム | double | モデル | aiplatform.googleapis.com/prediction/internal/gdc/ig/response_time | CUMULATIVE | DISTRIBUTION | モデル |
ig_ops_ffmpeg_image_latency | ヒストグラム | double | モデル | aiplatform.googleapis.com/prediction/internal/gdc/ig/ffmpeg_image_latencies | CUMULATIVE | DISTRIBUTION | モデル |
ig_ops_ffmpeg_video_latency | ヒストグラム | double | モデル | aiplatform.googleapis.com/prediction/internal/gdc/ig/ffmpeg_video_latencies | CUMULATIVE | DISTRIBUTION | モデル |
ig_ops_ffmpeg_audio_latency | ヒストグラム | double | モデル | aiplatform.googleapis.com/prediction/internal/gdc/ig/ffmpeg_audio_latencies | CUMULATIVE | DISTRIBUTION | モデル |
ig_time_to_first_token | ヒストグラム | double | モデルのコンテキスト ウィンドウ | aiplatform.googleapis.com/prediction/internal/gdc/ig/ttft | CUMULATIVE | DISTRIBUTION | モデルのコンテキスト ウィンドウ |
ig_time_per_output_token | ヒストグラム | double | モデルのコンテキスト ウィンドウ | aiplatform.googleapis.com/prediction/internal/gdc/ig/tpot | CUMULATIVE | DISTRIBUTION | モデルのコンテキスト ウィンドウ |
ig_cache_hit | カウンタ | モデル | aiplatform.googleapis.com/prediction/internal/gdc/ig/cache_hit_count | CUMULATIVE | DISTRIBUTION | model _gdch_project | |
ig_cache_miss | カウンタ | モデル | aiplatform.googleapis.com/prediction/internal/gdc/ig/cache_miss_count | CUMULATIVE | DISTRIBUTION | model _gdch_project |
GenAI Router の指標
Prometheus 指標名 | 指標タイプ | Datatype | ラベル | 化学物質の種類 | Chemist metric_kind | Chemist の value_type | 薬剤師ラベル |
---|---|---|---|---|---|---|---|
llm_total_request_latency_milliseconds | ヒストグラム | double | context_window モデル | aiplatform.googleapis.com/prediction/internal/gdc/gair/total_request_latencies | CUMULATIVE | DISTRIBUTION | context_window モデル |
llm_unary_request_latency_milliseconds | ヒストグラム | double | context_window モデル | aiplatform.googleapis.com/prediction/internal/gdc/gair/unary_request_latencies | CUMULATIVE | DISTRIBUTION | context_window モデル |
llm_streaming_ttft_milliseconds | ヒストグラム | double | context_window モデル | aiplatform.googleapis.com/prediction/internal/gdc/gair/ttft_ms | CUMULATIVE | DISTRIBUTION | context_window モデル |
llm_streaming_tpot_milliseconds | ヒストグラム | double | context_window モデル | aiplatform.googleapis.com/prediction/internal/gdc/gair/tpot_ms | CUMULATIVE | DISTRIBUTION | context_window モデル |
llm_input_token_count | ヒストグラム | double | モデル | aiplatform.googleapis.com/prediction/internal/gdc/gair/input_token_count | CUMULATIVE | DISTRIBUTION | モデル |
llm_output_token_count | ヒストグラム | double | モデル | aiplatform.googleapis.com/prediction/internal/gdc/gair/output_token_count | CUMULATIVE | DISTRIBUTION | モデル |
llm_success_response_count | カウンタ | double | モデル | aiplatform.googleapis.com/prediction/internal/gdc/gair/success_response_count | CUMULATIVE | INT64 | モデル |
llm_failure_response_count | カウンタ | double | モデル | aiplatform.googleapis.com/prediction/internal/gdc/gair/failure_response_count | CUMULATIVE | INT64 | モデル |
llm_text_tokenization_latency_milliseconds | ヒストグラム | double | モデル | aiplatform.googleapis.com/prediction/internal/gdc/gair/text_tokenization_latencies | CUMULATIVE | DISTRIBUTION | モデル |
llm_image_tokenization_latency_milliseconds | ヒストグラム | double | aiplatform.googleapis.com/prediction/internal/gdc/gair/image_tokenization_latencies | CUMULATIVE | DISTRIBUTION | ||
llm_audio_tokenization_latency_milliseconds | ヒストグラム | double | aiplatform.googleapis.com/prediction/internal/gdc/gair/audio_tokenization_latencies | CUMULATIVE | DISTRIBUTION |
GPU 指標
Prometheus 指標名 | 指標タイプ | Datatype | ラベル | 化学物質の種類 | Chemist metric_kind | Chemist の value_type | 薬剤師ラベル |
---|---|---|---|---|---|---|---|
DCGM_FI_DEV_MEM_COPY_UTIL | ゲージ | int64 | gpu UUID pci_bus_id device modelName Hostname DCGM_FI_DRIVER_VERSION | aiplatform.googleapis.com/prediction/internal/gdc/gpu/memory_util | GAUGE | INT64 | uuid gpu_model |
DCGM_FI_DEV_MEMORY_TEMP | ゲージ | int64 | 上記と同じ | aiplatform.googleapis.com/prediction/internal/gdc/gpu/memory_temp | GAUGE | INT64 | 上記と同じ |
DCGM_FI_DEV_POWER_USAGE | ゲージ | double | 上記と同じ | aiplatform.googleapis.com/prediction/internal/gdc/gpu/power_usage | GAUGE | DOUBLE | 上記と同じ |
DCGM_FI_DEV_GPU_TEMP | ゲージ | double | 上記と同じ | aiplatform.googleapis.com/prediction/internal/gdc/gpu/gpu_temp | GAUGE | INT64 | 上記と同じ |
DCGM_FI_DEV_GPU_UTIL | ゲージ | double | 上記と同じ | aiplatform.googleapis.com/prediction/internal/gdc/gpu/gpu_util | GAUGE | INT64 | 上記と同じ |
DCGM_FI_DEV_ENC_UTIL | ゲージ | int64 | 上記と同じ | aiplatform.googleapis.com/prediction/internal/gdc/gpu/encode_util | GAUGE | INT64 | 上記と同じ |
DCGM_FI_DEV_XID_ERRORS | カウンタ | int64 | 上記と同じ | aiplatform.googleapis.com/prediction/internal/gdc/gpu/xid_errors | CUMULATIVE | INT64 | 上記と同じ |
DCGM_FI_DEV_POWER_VIOLATION | カウンタ | int64 | 上記と同じ | aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_power | CUMULATIVE | INT64 | 上記と同じ |
DCGM_FI_DEV_THERMAL_VIOLATION | カウンタ | int64 | 上記と同じ | aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_thermal | CUMULATIVE | INT64 | 上記と同じ |
DCGM_FI_DEV_SYNC_BOOST_VIOLATION | カウンタ | int64 | 上記と同じ | aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_sync_boost | CUMULATIVE | INT64 | 上記と同じ |
DCGM_FI_DEV_BOARD_LIMIT_VIOLATION | カウンタ | int64 | 上記と同じ | aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_board_limit | CUMULATIVE | INT64 | 上記と同じ |
DCGM_FI_DEV_LOW_UTIL_VIOLATION | カウンタ | int64 | 上記と同じ | aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_low_util | CUMULATIVE | INT64 | 上記と同じ |
DCGM_FI_DEV_RELIABILITY_VIOLATION | カウンタ | int64 | 上記と同じ | aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_reliability | CUMULATIVE | INT64 | 上記と同じ |