Logs und Messwerte

In diesem Dokument werden die Logs und Messwerte beschrieben, die von der verbundenen API von Gemini on Google Distributed Cloud erfasst und exportiert werden.

Logging und Monitoring konfigurieren

Bevor Sie mit dem Erfassen von Logs und Messwerten beginnen können, müssen Sie Folgendes tun:

Aktivieren Sie die Logging APIs mit den folgenden Befehlen:

gcloud services enable opsconfigmonitoring.googleapis.com --project PROJECT_ID
gcloud services enable logging.googleapis.com --project PROJECT_ID
gcloud services enable monitoring.googleapis.com --project PROJECT_ID

Ersetzen Sie PROJECT_ID durch die ID des Zielprojekts Google Cloud .

Weisen Sie die Rollen zu, die zum Schreiben von Logs und Messwerten erforderlich sind:

gcloud projects add-iam-policy-binding PROJECT_ID \
    --role roles/opsconfigmonitoring.resourceMetadata.writer \
    --member "serviceAccount:PROJECT_ID.svc.id.goog[kube-system/metadata-agent]"

gcloud projects add-iam-policy-binding PROJECT_ID \
    --role roles/logging.logWriter \
     --member "serviceAccount:PROJECT_ID.svc.id.goog[kube-system/stackdriver-log-forwarder]"

gcloud projects add-iam-policy-binding PROJECT_ID \
    --role roles/monitoring.metricWriter \
    --member "serviceAccount:PROJECT_ID.svc.id.goog[kube-system/gke-metrics-agent]"

Ersetzen Sie PROJECT_ID durch die ID des Zielprojekts Google Cloud .

Logs

In diesem Abschnitt werden die Cloud Logging-Ressourcentypen aufgeführt, die von der Gemini on GDC connected API unterstützt werden. Wenn Sie sich Logs für die API für Gemini auf GDC Connected ansehen möchten, verwenden Sie den Log-Explorer in der Google Cloud Console. Die Protokollierung von Gemini auf GDC-verbundenen APIs ist immer aktiviert.

Der protokollierte Ressourcentyp für die API-Verbindung von Gemini on GDC connected ist aiplatform.googleapis.com/Endpoint.

Sie können auch Logs von Gemini on GDC-verbundenen APIs mit der Cloud Logging API erfassen und abrufen. Informationen zum Konfigurieren dieses Logging-Mechanismus finden Sie in der Dokumentation zu Cloud Logging-Clientbibliotheken.

Messwerte

In diesem Abschnitt werden die Cloud Monitoring-Messwerte aufgeführt, die von der Gemini on GDC-API unterstützt werden. Wenn Sie Messwerte für Gemini-APIs mit GDC-Verbindung aufrufen möchten, verwenden Sie den Metrics Explorer in derGoogle Cloud -Konsole.

Clustermesswerte für Distributed Cloud Connected

Gemini on GDC Connected API-Endpunkte werden in Distributed Cloud Connected-Clustern bereitgestellt. Informationen zu Logs und Messwerten für Distributed Cloud Connected finden Sie unter Logs und Messwerte.

Messwerte für Inference Gateway

Prometheus-Messwertname	Messwerttyp	Datentyp	Labels	Chemiker-Typ	Chemist-Messwertart	Chemist-Werttyp	Chemiker-Labels
ig_ops_successful_incoming_requests	Zähler		Modell	aiplatform.googleapis.com/prediction/internal/gdc/ig/successful_requests	CUMULATIVE	INT64	Modell
ig_ops_unique_users	Zähler		Modell	aiplatform.googleapis.com/prediction/internal/gdc/ig/unique_users	CUMULATIVE	INT64	Modell
ig_tokens_per_minute	Histogramm	double	Modell	aiplatform.googleapis.com/prediction/internal/gdc/ig/tokens_per_min	CUMULATIVE	VERTRIEB	Modell
ig_total_response_time	Histogramm	double	Modell	aiplatform.googleapis.com/prediction/internal/gdc/ig/response_time	CUMULATIVE	VERTRIEB	Modell
ig_ops_ffmpeg_image_latency	Histogramm	double	Modell	aiplatform.googleapis.com/prediction/internal/gdc/ig/ffmpeg_image_latencies	CUMULATIVE	VERTRIEB	Modell
ig_ops_ffmpeg_video_latency	Histogramm	double	Modell	aiplatform.googleapis.com/prediction/internal/gdc/ig/ffmpeg_video_latencies	CUMULATIVE	VERTRIEB	Modell
ig_ops_ffmpeg_audio_latency	Histogramm	double	Modell	aiplatform.googleapis.com/prediction/internal/gdc/ig/ffmpeg_audio_latencies	CUMULATIVE	VERTRIEB	Modell
ig_time_to_first_token	Histogramm	double	Kontextfenster des Modells	aiplatform.googleapis.com/prediction/internal/gdc/ig/ttft	CUMULATIVE	VERTRIEB	Kontextfenster des Modells
ig_time_per_output_token	Histogramm	double	Kontextfenster des Modells	aiplatform.googleapis.com/prediction/internal/gdc/ig/tpot	CUMULATIVE	VERTRIEB	Kontextfenster des Modells
ig_cache_hit	Zähler		Modell	aiplatform.googleapis.com/prediction/internal/gdc/ig/cache_hit_count	CUMULATIVE	VERTRIEB	model _gdch_project
ig_cache_miss	Zähler		Modell	aiplatform.googleapis.com/prediction/internal/gdc/ig/cache_miss_count	CUMULATIVE	VERTRIEB	model _gdch_project

Messwerte für den GenAI-Router

Prometheus-Messwertname	Messwerttyp	Datentyp	Labels	Chemiker-Typ	Chemist-Messwertart	Chemist-Werttyp	Chemiker-Labels
llm_total_request_latency_milliseconds	Histogramm	double	Kontextfenstermodell	aiplatform.googleapis.com/prediction/internal/gdc/gair/total_request_latencies	CUMULATIVE	VERTRIEB	Kontextfenstermodell
llm_unary_request_latency_milliseconds	Histogramm	double	Kontextfenstermodell	aiplatform.googleapis.com/prediction/internal/gdc/gair/unary_request_latencies	CUMULATIVE	VERTRIEB	Kontextfenstermodell
llm_streaming_ttft_milliseconds	Histogramm	double	Kontextfenstermodell	aiplatform.googleapis.com/prediction/internal/gdc/gair/ttft_ms	CUMULATIVE	VERTRIEB	Kontextfenstermodell
llm_streaming_tpot_milliseconds	Histogramm	double	Kontextfenstermodell	aiplatform.googleapis.com/prediction/internal/gdc/gair/tpot_ms	CUMULATIVE	VERTRIEB	Kontextfenstermodell
llm_input_token_count	Histogramm	double	Modell	aiplatform.googleapis.com/prediction/internal/gdc/gair/input_token_count	CUMULATIVE	VERTRIEB	Modell
llm_output_token_count	Histogramm	double	Modell	aiplatform.googleapis.com/prediction/internal/gdc/gair/output_token_count	CUMULATIVE	VERTRIEB	Modell
llm_success_response_count	Zähler	double	Modell	aiplatform.googleapis.com/prediction/internal/gdc/gair/success_response_count	CUMULATIVE	INT64	Modell
llm_failure_response_count	Zähler	double	Modell	aiplatform.googleapis.com/prediction/internal/gdc/gair/failure_response_count	CUMULATIVE	INT64	Modell
llm_text_tokenization_latency_milliseconds	Histogramm	double	Modell	aiplatform.googleapis.com/prediction/internal/gdc/gair/text_tokenization_latencies	CUMULATIVE	VERTRIEB	Modell
llm_image_tokenization_latency_milliseconds	Histogramm	double		aiplatform.googleapis.com/prediction/internal/gdc/gair/image_tokenization_latencies	CUMULATIVE	VERTRIEB
llm_audio_tokenization_latency_milliseconds	Histogramm	double		aiplatform.googleapis.com/prediction/internal/gdc/gair/audio_tokenization_latencies	CUMULATIVE	VERTRIEB

GPU-Messwerte

Prometheus-Messwertname	Messwerttyp	Datentyp	Labels	Chemiker-Typ	Chemist-Messwertart	Chemist-Werttyp	Chemiker-Labels
DCGM_FI_DEV_MEM_COPY_UTIL	Gauge	int64	gpu UUID pci_bus_id device modelName Hostname DCGM_FI_DRIVER_VERSION	aiplatform.googleapis.com/prediction/internal/gdc/gpu/memory_util	ANZEIGE	INT64	uuid gpu_model
DCGM_FI_DEV_MEMORY_TEMP	Gauge	int64	Wie oben	aiplatform.googleapis.com/prediction/internal/gdc/gpu/memory_temp	ANZEIGE	INT64	Wie oben
DCGM_FI_DEV_POWER_USAGE	Gauge	double	Wie oben	aiplatform.googleapis.com/prediction/internal/gdc/gpu/power_usage	ANZEIGE	DOUBLE	Wie oben
DCGM_FI_DEV_GPU_TEMP	Gauge	double	Wie oben	aiplatform.googleapis.com/prediction/internal/gdc/gpu/gpu_temp	ANZEIGE	INT64	Wie oben
DCGM_FI_DEV_GPU_UTIL	Gauge	double	Wie oben	aiplatform.googleapis.com/prediction/internal/gdc/gpu/gpu_util	ANZEIGE	INT64	Wie oben
DCGM_FI_DEV_ENC_UTIL	Gauge	int64	Wie oben	aiplatform.googleapis.com/prediction/internal/gdc/gpu/encode_util	ANZEIGE	INT64	Wie oben
DCGM_FI_DEV_XID_ERRORS	Zähler	int64	Wie oben	aiplatform.googleapis.com/prediction/internal/gdc/gpu/xid_errors	CUMULATIVE	INT64	Wie oben
DCGM_FI_DEV_POWER_VIOLATION	Zähler	int64	Wie oben	aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_power	CUMULATIVE	INT64	Wie oben
DCGM_FI_DEV_THERMAL_VIOLATION	Zähler	int64	Wie oben	aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_thermal	CUMULATIVE	INT64	Wie oben
DCGM_FI_DEV_SYNC_BOOST_VIOLATION	Zähler	int64	Wie oben	aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_sync_boost	CUMULATIVE	INT64	Wie oben
DCGM_FI_DEV_BOARD_LIMIT_VIOLATION	Zähler	int64	Wie oben	aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_board_limit	CUMULATIVE	INT64	Wie oben
DCGM_FI_DEV_LOW_UTIL_VIOLATION	Zähler	int64	Wie oben	aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_low_util	CUMULATIVE	INT64	Wie oben
DCGM_FI_DEV_RELIABILITY_VIOLATION	Zähler	int64	Wie oben	aiplatform.googleapis.com/prediction/internal/gdc/gpu/violation_reliability	CUMULATIVE	INT64	Wie oben