이 문서에서는 Google Distributed Cloud Connected API의 Gemini가 수집하고 내보내는 로그와 측정항목을 설명합니다.
로깅 및 모니터링 구성
로그와 측정항목을 수집하기 전에 다음을 수행해야 합니다.
다음 명령어를 사용하여 로깅 API를 사용 설정합니다.
gcloud services enable opsconfigmonitoring.googleapis.com --project PROJECT_ID gcloud services enable logging.googleapis.com --project PROJECT_ID gcloud services enable monitoring.googleapis.com --project PROJECT_ID
PROJECT_ID
를 타겟 Google Cloud 프로젝트의 ID로 바꿉니다.로그 및 측정항목을 작성하는 데 필요한 역할을 부여합니다.
gcloud projects add-iam-policy-binding PROJECT_ID \ --role roles/opsconfigmonitoring.resourceMetadata.writer \ --member "serviceAccount:PROJECT_ID.svc.id.goog[kube-system/metadata-agent]" gcloud projects add-iam-policy-binding PROJECT_ID \ --role roles/logging.logWriter \ --member "serviceAccount:PROJECT_ID.svc.id.goog[kube-system/stackdriver-log-forwarder]" gcloud projects add-iam-policy-binding PROJECT_ID \ --role roles/monitoring.metricWriter \ --member "serviceAccount:PROJECT_ID.svc.id.goog[kube-system/gke-metrics-agent]"
PROJECT_ID
를 타겟 Google Cloud 프로젝트의 ID로 바꿉니다.
로그
이 섹션에는 GDC 연결 API의 Gemini에서 지원하는 Cloud Logging 리소스 유형이 나열되어 있습니다. GDC 연결 API 로그에서 Gemini를 보려면 Google Cloud 콘솔에서 로그 탐색기를 사용하세요. Gemini on GDC connected API} 로깅은 항상 사용 설정되어 있습니다.
GDC 연결 Gemini API 연결 로깅된 리소스 유형은 aiplatform.googleapis.com/Endpoint
입니다.
Cloud Logging API를 사용하여 GDC 연결 Gemini의 API 연결 로그를 캡처하고 검색할 수도 있습니다. 이 로깅 메커니즘을 구성하는 방법에 대한 자세한 내용은 Cloud Logging 클라이언트 라이브러리 문서를 참고하세요.
측정항목
이 섹션에는 GDC 연결 API의 Gemini에서 지원하는 Cloud Monitoring 측정항목이 나와 있습니다. GDC 연결 API 측정항목의 Gemini를 보려면Google Cloud 콘솔에서 측정항목 탐색기를 사용하세요.
Distributed Cloud Connected 클러스터 측정항목
GDC 연결 API의 Gemini 엔드포인트는 Distributed Cloud 연결 클러스터에 배포됩니다. Distributed Cloud Connected의 로그 및 측정항목에 대한 자세한 내용은 로그 및 측정항목을 참고하세요.
추론 게이트웨이 측정항목
Prometheus 측정항목 이름 | 측정항목 유형 | 데이터 유형 | 라벨 | 화학자 유형 | Chemist metric_kind | Chemist value_type | 약사 라벨 |
---|---|---|---|---|---|---|---|
ig_ops_successful_incoming_requests | 카운터 | 모델 | aiplatform.googleapis.com/prediction/internal/gdc/ig/successful_requests | 누적 | INT64 | 모델 | |
ig_ops_unique_users | 카운터 | 모델 | aiplatform.googleapis.com/prediction/internal/gdc/ig/unique_users | 누적 | INT64 | 모델 | |
ig_tokens_per_minute | 히스토그램 | double | 모델 | aiplatform.googleapis.com/prediction/internal/gdc/ig/tokens_per_min | 누적 | DISTRIBUTION | 모델 |
ig_total_response_time | 히스토그램 | double | 모델 | aiplatform.googleapis.com/prediction/internal/gdc/ig/response_time | 누적 | DISTRIBUTION | 모델 |
ig_ops_ffmpeg_image_latency | 히스토그램 | double | 모델 | aiplatform.googleapis.com/prediction/internal/gdc/ig/ffmpeg_image_latencies | 누적 | DISTRIBUTION | 모델 |
ig_ops_ffmpeg_video_latency | 히스토그램 | double | 모델 | aiplatform.googleapis.com/prediction/internal/gdc/ig/ffmpeg_video_latencies | 누적 | DISTRIBUTION | 모델 |
ig_ops_ffmpeg_audio_latency | 히스토그램 | double | 모델 | aiplatform.googleapis.com/prediction/internal/gdc/ig/ffmpeg_audio_latencies | 누적 | DISTRIBUTION | 모델 |
ig_time_to_first_token | 히스토그램 | double | 모델 컨텍스트 윈도우 | aiplatform.googleapis.com/prediction/internal/gdc/ig/ttft | 누적 | DISTRIBUTION | 모델 컨텍스트 윈도우 |
ig_time_per_output_token | 히스토그램 | double | 모델 컨텍스트 윈도우 | aiplatform.googleapis.com/prediction/internal/gdc/ig/tpot | 누적 | DISTRIBUTION | 모델 컨텍스트 윈도우 |
ig_cache_hit | 카운터 | 모델 | aiplatform.googleapis.com/prediction/internal/gdc/ig/cache_hit_count | 누적 | DISTRIBUTION | model _gdch_project | |
ig_cache_miss | 카운터 | 모델 | aiplatform.googleapis.com/prediction/internal/gdc/ig/cache_miss_count | 누적 | DISTRIBUTION | model _gdch_project |
생성형 AI 라우터 측정항목
Prometheus 측정항목 이름 | 측정항목 유형 | 데이터 유형 | 라벨 | 화학자 유형 | Chemist metric_kind | Chemist value_type | 약사 라벨 |
---|---|---|---|---|---|---|---|
llm_total_request_latency_milliseconds | 히스토그램 | double | 컨텍스트 윈도우 모델 | aiplatform.googleapis.com/prediction/internal/gdc/gair/total_request_latencies | 누적 | DISTRIBUTION | 컨텍스트 윈도우 모델 |
llm_unary_request_latency_milliseconds | 히스토그램 | double | 컨텍스트 윈도우 모델 | aiplatform.googleapis.com/prediction/internal/gdc/gair/unary_request_latencies | 누적 | DISTRIBUTION | 컨텍스트 윈도우 모델 |
llm_streaming_ttft_milliseconds | 히스토그램 | double | 컨텍스트 윈도우 모델 | aiplatform.googleapis.com/prediction/internal/gdc/gair/ttft_ms | 누적 | DISTRIBUTION | 컨텍스트 윈도우 모델 |
llm_streaming_tpot_milliseconds | 히스토그램 | double | 컨텍스트 윈도우 모델 | aiplatform.googleapis.com/prediction/internal/gdc/gair/tpot_ms | 누적 | DISTRIBUTION | 컨텍스트 윈도우 모델 |
llm_input_token_count | 히스토그램 | double | 모델 | aiplatform.googleapis.com/prediction/internal/gdc/gair/input_token_count | 누적 | DISTRIBUTION | 모델 |
llm_output_token_count | 히스토그램 | double | 모델 | aiplatform.googleapis.com/prediction/internal/gdc/gair/output_token_count | 누적 | DISTRIBUTION | 모델 |
llm_success_response_count | 카운터 | double | 모델 | aiplatform.googleapis.com/prediction/internal/gdc/gair/success_response_count | 누적 | INT64 | 모델 |
llm_failure_response_count | 카운터 | double | 모델 | aiplatform.googleapis.com/prediction/internal/gdc/gair/failure_response_count | 누적 | INT64 | 모델 |
llm_text_tokenization_latency_milliseconds | 히스토그램 | double | 모델 | aiplatform.googleapis.com/prediction/internal/gdc/gair/text_tokenization_latencies | 누적 | DISTRIBUTION | 모델 |
llm_image_tokenization_latency_milliseconds | 히스토그램 | double | aiplatform.googleapis.com/prediction/internal/gdc/gair/image_tokenization_latencies | 누적 | DISTRIBUTION | ||
llm_audio_tokenization_latency_milliseconds | 히스토그램 | double | aiplatform.googleapis.com/prediction/internal/gdc/gair/audio_tokenization_latencies | 누적 | DISTRIBUTION |
GPU 측정항목
Prometheus 측정항목 이름 | 측정항목 유형 | 데이터 유형 | 라벨 | 화학자 유형 | Chemist metric_kind | Chemist value_type | 약사 라벨 |
---|---|---|---|---|---|---|---|
DCGM_FI_DEV_MEM_COPY_UTIL | 게이지 | int64 | GPU UUID pci_bus_id device modelName Hostname DCGM_FI_DRIVER_VERSION | aiplatform.googleapis.com/prediction/internal/gdc/gpu/memory_util | 게이지 | INT64 | uuid gpu_model |
DCGM_FI_DEV_MEMORY_TEMP | 게이지 | int64 | 위와 동일 | aiplatform.googleapis.com/prediction/internal/gdc/gpu/memory_temp | 게이지 | INT64 | 위와 동일 |
DCGM_FI_DEV_POWER_USAGE | 게이지 | double | 위와 동일 | aiplatform.googleapis.com/prediction/internal/gdc/gpu/power_usage | 게이지 | DOUBLE | 위와 동일 |
DCGM_FI_DEV_GPU_TEMP | 게이지 | double | 위와 동일 | aiplatform.googleapis.com/prediction/internal/gdc/gpu/gpu_temp | 게이지 | INT64 | 위와 동일 |
DCGM_FI_DEV_GPU_UTIL | 게이지 | double | 위와 동일 | aiplatform.googleapis.com/prediction/internal/gdc/gpu/gpu_util | 게이지 | INT64 | 위와 동일 |
DCGM_FI_DEV_ENC_UTIL | 게이지 | int64 | 위와 동일 | aiplatform.googleapis.com/prediction/internal/gdc/gpu/encode_util | 게이지 | INT64 | 위와 동일 |
DCGM_FI_DEV_XID_ERRORS | 카운터 | int64 | 위와 동일 | aiplatform.googleapis.com/prediction/internal/gdc/gpu/xid_errors | 누적 | INT64 | 위와 동일 |
DCGM_FI_DEV_POWER_VIOLATION | 카운터 | int64 | 위와 동일 | aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_power | 누적 | INT64 | 위와 동일 |
DCGM_FI_DEV_THERMAL_VIOLATION | 카운터 | int64 | 위와 동일 | aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_thermal | 누적 | INT64 | 위와 동일 |
DCGM_FI_DEV_SYNC_BOOST_VIOLATION | 카운터 | int64 | 위와 동일 | aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_sync_boost | 누적 | INT64 | 위와 동일 |
DCGM_FI_DEV_BOARD_LIMIT_VIOLATION | 카운터 | int64 | 위와 동일 | aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_board_limit | 누적 | INT64 | 위와 동일 |
DCGM_FI_DEV_LOW_UTIL_VIOLATION | 카운터 | int64 | 위와 동일 | aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_low_util | 누적 | INT64 | 위와 동일 |
DCGM_FI_DEV_RELIABILITY_VIOLATION | 카운터 | int64 | 위와 동일 | aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_reliability | 누적 | INT64 | 위와 동일 |