Cloud Data Fusion-Logs aufrufen

In diesem Dokument wird beschrieben, wie Sie auf Pipeline- und Dienstlogs für Cloud Data Fusion zugreifen und diese ansehen.

Ab Cloud Data Fusion-Version 6.11 sind Pipeline-Logs und Dienstlogs in Cloud Logging verfügbar.

Logtypen

Cloud Data Fusion generiert verschiedene Arten von Logs, mit denen Sie Datenintegrationsprozesse überwachen und Fehler beheben können:

Pipeline-Logs
Diese Logs enthalten detaillierte Informationen zu einzelnen Pipeline-Ausführungen, einschließlich Vorschauausführungen. Sie decken alle Phasen einer Pipelineausführung ab, z. B. die Einrichtung vor der Ausführung, die Jobausführung und die Aktivitäten nach der Ausführung.

Dienstprotokolle
Diese Logs enthalten detaillierte Informationen zu Cloud Data Fusion-Systemdiensten wie AppFabric und AppFabric-Prozessor.

Audit-Logs
Cloud Data Fusion generiert Audit-Logs, z. B. Audit-Logs zu Administratoraktivitäten. Weitere Informationen finden Sie unter Cloud Data Fusion-Audit-Logging.

Erweiterte Pipeline-Logs
Diese Logs enthalten detaillierte Informationen zu einzelnen Pipeline-Ausführungen. Diese Logs sind besonders nützlich für die Fehlerbehebung bei Pipelinefehlern, da sie Informationen erfassen, noch bevor die Bereitstellung des Dataproc-Clusters abgeschlossen ist. So können Clusterprobleme oder Verzögerungen erkannt werden. Weitere Informationen finden Sie unter Erweiterte Pipeline-Logs in Cloud Logging ansehen.

Preise

Für die Nutzung von Cloud Logging und Cloud Monitoring fallen Gebühren an. Weitere Informationen finden Sie unter Google Cloud Observability-Preise.

Optional: Cloud Data Fusion-Logging-Dashboard importieren

Wenn Sie Pipeline-Logs und Dienstlogs über das Cloud Data Fusion-Logging-Dashboard aufrufen möchten, importieren Sie das Dashboard:

  1. Rufen Sie in der Google Cloud Console die Cloud Monitoring-Seite Dashboards auf.

    Dashboards aufrufen

  2. Klicken Sie auf Dashboardvorlagen ansehen.

  3. Suchen Sie nach Cloud Data Fusion Logging und wählen Sie das Dashboard aus.

  4. Klicken Sie auf Cloud Data Fusion-Logging-Dashboard zu Ihrer Liste hinzufügen.

Pipeline-Logs ansehen

Sie können Pipeline-Logs über das Cloud Data Fusion-Logging-Dashboard oder direkt im Log-Explorer aufrufen.

Pipelinelogs über das Dashboard ansehen

  1. Importieren Sie das Cloud Data Fusion Logging-Dashboard, falls noch nicht geschehen.

  2. Klicken Sie im Bereich Meine Dashboards auf Cloud Data Fusion-Logging.

  3. Im Abschnitt Pipeline-Logs sehen Sie die Liste der Pipeline-Logs. Sie können die Logs nach Schweregrad, Feldnamen und Werten filtern.

    Wenn Sie Ihre Suche mit Abfragen verfeinern möchten, verwenden Sie den Log-Explorer.

Pipeline-Logs im Log-Explorer ansehen

  1. Rufen Sie in der Google Cloud Console die Seite Log-Explorer auf.

    Zum Log-Explorer

  2. Geben Sie die folgende Abfrage ein:

    resource.type="datafusion.googleapis.com/PipelineV2"
    

    Dadurch wird die Liste der Pipeline-Logs angezeigt. Mit Filtern können Sie die Ergebnisse eingrenzen.

Pipeline-Logs filtern

Sie können Pipeline-Logs nach Ausführungs-ID, Instanz-ID, Pipeline-ID, Standort, Namespace oder benutzerdefinierten Labels filtern.

Jeder Cloud Data Fusion-Pipelineausführung wird eine eindeutige RunID zugewiesen. Nachdem Sie Ihre Pipeline bereitgestellt und ausgeführt haben, können Sie das RunID Ihrer Pipeline aufrufen und die entsprechenden Pipeline-Logs ansehen.

So filtern Sie Pipeline-Logs nach RunID:

  1. Ausführungs-ID der Pipeline abrufen.

  2. Rufen Sie in der Google Cloud Console die Seite Log-Explorer auf.

  3. Geben Sie die folgende Abfrage ein:

    resource.type="datafusion.googleapis.com/PipelineV2" resource.labels.run_id=RUN_ID
    

Dienstlogs ansehen

Sie können Dienstlogs über das Cloud Data Fusion-Logging-Dashboard oder im Log-Explorer aufrufen.

Dienstlogs über das Dashboard ansehen

  1. Importieren Sie das Cloud Data Fusion Logging-Dashboard, falls noch nicht geschehen.

  2. Klicken Sie im Bereich Meine Dashboards auf Cloud Data Fusion-Logging.

  3. Sehen Sie sich im Abschnitt Dienstlogs die Liste der Dienstlogs an. Sie können die Logs nach Schweregrad, Feldnamen und Werten filtern.

    Wenn Sie Ihre Suche mit Abfragen verfeinern möchten, verwenden Sie den Log-Explorer.

Dienstlogs im Log-Explorer ansehen

  1. Rufen Sie in der Google Cloud Console die Seite Log-Explorer auf.

    Zum Log-Explorer

  2. Geben Sie die spezifische Anfrage für den jeweiligen Dienst ein, um die Dienstprotokolle zu finden.

    Dienstname Logabfrage
    Appfabric
    resource.type="datafusion.googleapis.com/InstanceV2"
    labels.".serviceId"="appfabric"
    
    AppFabric-Prozessor
    resource.type="datafusion.googleapis.com/InstanceV2"
    labels.".serviceId"="appfabric.processor"
    
    Dataset-Executor
    resource.type="datafusion.googleapis.com/InstanceV2"
    labels.".serviceId"="dataset.executor"
    
    Log-Saver
    resource.type="datafusion.googleapis.com/InstanceV2"
    labels.".serviceId"="log.saver"
    
    Metadatendienst
    resource.type="datafusion.googleapis.com/InstanceV2"
    labels.".serviceId"="metadata.service"
    
    Messwerte
    resource.type="datafusion.googleapis.com/InstanceV2"
    labels.".serviceId"="metrics"
    
    Pipeline Studio
    resource.type="datafusion.googleapis.com/InstanceV2" 
    resource.labels.namespace="system"
    labels.".userserviceid"="studio"
    
    Laufzeit
    resource.type="datafusion.googleapis.com/InstanceV2"
    labels.".serviceId"="runtime"
    
    Wrangler-Dienst
    resource.type="datafusion.googleapis.com/InstanceV2"
    resource.labels.namespace="system"
    labels.".applicationId"="dataprep"
    labels.".userserviceid"="service"
    

Konfigurierbares Logging in Cloud Data Fusion

Cloud Data Fusion 6.11.0 bietet konfigurierbares Logging, wobei Cloud Logging standardmäßig aktiviert ist. Cloud Logging kann zwar deaktiviert werden, es wird jedoch dringend empfohlen, es aktiviert zu lassen, damit Sie auf wichtige Pipeline- und Instanzlogs zugreifen können.

Führen Sie den folgenden Befehl aus, um Cloud Logging zu deaktivieren:

echo '{ "loggingConfig": {"instance_cloud_logging_disabled": "true"}}' | curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" \
    --data @- \
    "https://datafusion.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=$INSTANCE_ID?updateMask=logging_config"

Ersetzen Sie Folgendes:

  • PROJECT_ID: die Google Cloud Projekt-ID
  • LOCATION: der Standort Ihrer Instanz
  • INSTANCE_ID: die ID Ihrer Cloud Data Fusion-Instanz

Nächste Schritte