Datenqualität für Medienempfehlungen prüfen

Auf dieser Seite wird beschrieben, wie du herausfindest, ob verschiedene Messwerte für deine Mediendaten die erforderlichen Grenzwerte erfüllen.

Qualität von Mediadaten prüfen

Da aktuelle Nutzerereignisse für Medienempfehlungen so wichtig sind, müssen Sie die Qualität der aufgenommenen Daten und Nutzerereignisse regelmäßig prüfen. Sehen Sie sich dazu den Tab Optimierung Ihrer App für Medienempfehlungen an. Dort sehen Sie, welche Verbesserungen Sie an Ihren Daten vornehmen können, um die Qualität der Empfehlungen zu optimieren.

Wenn der Grenzwert eines Messwerts nicht erreicht wird, hat der Messwert den Status „Warnung“. Prüfen Sie dann den Messwert und seine Beschreibung, um festzustellen, welche Maßnahmen Sie ergreifen sollten, um die Medienqualität zu verbessern.

Alle Modelle und Zielvorhaben müssen die Grenzwerte für die allgemeine Qualität erreichen. Für einige Modelle und Zielvorhaben gelten zusätzliche App-spezifische Qualitätsmesswerte und ‑grenzwerte. Die allgemeinen Qualitätsmesswerte sind für alle Apps mit demselben Datenspeicher identisch. App-spezifische Qualitätsmesswerte variieren jedoch je nach Modell und Zielvorhaben der App.

Informationen zu den Empfehlungsmodellen und -zielen finden Sie unter Arten von Empfehlungen für Medien-Apps.

Datenqualität prüfen

Console

So prüfen Sie die Qualität Ihrer Daten für Medienempfehlungen:

  1. Rufen Sie in der Google Cloud Console die Seite Agent Builder auf.

    Zum Agent Builder

  2. Klicken Sie auf den Namen der App für Medienempfehlungen, für die Sie die Datenqualität prüfen möchten.

  3. Klicken Sie im Navigationsmenü auf Datenqualität und dann auf den Tab Optimierung. Auf dieser Seite sehen Sie den Status verschiedener Messwerte für die Daten, die mit Ihrer App verknüpft sind.

  4. Sehen Sie sich oben auf der Seite die Status Allgemeine Qualität und App-spezifische Qualität an. Wenn ein oder mehrere Messwerte den Grenzwert überschritten haben, wird oben auf der Seite eine Warnung angezeigt.

    In den beiden Tabellen mit Messwerten (Allgemeine Qualität und App-spezifische Qualität) sind die einzelnen Messwerte aufgeführt.

    Auf dem Tab „Optimierung“ wird ein Warnmesswert für die allgemeine Qualität angezeigt: doc_with_same_title_percentage

  5. Klicken Sie in den Messwerttabellen auf Details ansehen, um weitere Informationen zu Messwerten im Warnstatus zu erhalten.

  6. Optional: Wenn Sie den Grenzwert für einen konformen Messwert sehen möchten, klicken Sie auf Details ansehen. Grenzwerte für konforme Messwerte werden in der Tabelle mit Messwerten nicht angezeigt.

REST

Verwenden Sie die Methode requirements:checkRequirement, um die Qualität Ihrer Daten zu Medienempfehlungen zu prüfen, wie hier gezeigt.

So prüfen Sie die Qualität über die Befehlszeile:

  1. Suchen Sie die Datenspeicher-ID. Wenn Sie die Datenspeicher-ID bereits haben, fahren Sie mit dem nächsten Schritt fort.

    1. Rufen Sie in der Google Cloud Console die Seite Agent Builder auf und klicken Sie im Navigationsmenü auf Datenspeicher.

      Zur Seite „Datenspeicher“

    2. Klicken Sie auf den Namen des Datenspeichers.

    3. Rufen Sie auf der Datenseite Ihres Datenspeichers die Datenspeicher-ID ab.

  2. Führen Sie den folgenden curl-Befehl aus, um zu sehen, ob Ihre Medienempfehlungen die Grenzwerte für die allgemeinen Messwerte erfüllen:

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" \
    -H "X-GFE-SSL: yes" \
    -H "X-Goog-User-Project: PROJECT_ID" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/requirements:checkRequirement" \
    -d '{
          "location": "projects/PROJECT_ID/locations/global",
          "requirementType": "discoveryengine.googleapis.com/media_recs/general/all/warning",
          "resources": [
            {
              "labels": {
                "branch_id": "0",
                "collection_id": "default_collection",
                "datastore_id": "DATA_STORE_ID",
                "location_id": "global",
                "project_number": "PROJECT_ID"
              },
              "type": "discoveryengine.googleapis.com/Branch"
            },
            {
              "labels": {
                "collection_id": "default_collection",
                "datastore_id": "DATA_STORE_ID",
                "location_id": "global",
                "project_number": "PROJECT_ID"
              },
              "type": "discoveryengine.googleapis.com/DataStore"
            }
          ]
        }'
    
    • PROJECT_ID ist die ID Ihres Google Cloud-Projekts.
    • DATA_STORE_ID: die ID des Vertex AI Search-Datenspeichers.
  3. Sehen Sie sich die Ausgabe an:

    1. Suchen Sie den Wert von result:

      • Wenn der Wert SUCCESS ist, erfüllen Ihre Daten die allgemeinen Anforderungen. Fahren Sie mit Schritt 4 fort.

      • Wenn der Wert WARNING ist, fahren Sie mit Schritt b fort.

      • Wenn result in der Ausgabe nicht angezeigt wird, kann das mehrere Gründe haben:

        • PROJECT_ID oder DATA_STORE_ID in der Anfrage ist falsch.

        • Einige Messwerte sind nicht verfügbar. Versuchen Sie es in sechs Stunden noch einmal oder wenden Sie sich an einen Kundenservicemitarbeiter.

    2. Suchen Sie nach dem Ausdruck (requirement.Condition.Expression): Wenn dieser Ausdruck als falsch ausgewertet wird, liegt ein Problem mit Ihren Daten vor.

      Die Werte der Messwerte finden Sie im Feld requirementCondition.metricResults.value. Die Werte für den Warnschwellenwert befinden sich in den Feldern thresholdBindings.thresholdValues. Anhand der Felder description können Sie den Zweck des Messwerts besser nachvollziehen.

      Angenommen, der Wert von doc_with_same_title_percentage ist 30.47 und der Warngrenzwert für doc_with_same_title_percentage_threshold ist 1. Es gibt ein Datenproblem, da viele der Titel im Datenspeicher identisch sind. Das muss untersucht werden.

  4. Wenn die für Ihre Empfehlungs-App verwendete Kombination aus Modell und Ziel in dieser Tabelle aufgeführt ist, müssen Sie auch die Methode zum Prüfen der Anforderungen aufrufen, die mit den Werten für Ihr Modell und Ziel aktualisiert wurde:

    Modell Ziel MODEL_OBJ
    Was Ihnen sonst noch gefallen könnte Conversion-Rate oyml/cvr
    Empfehlungen für mich Conversion-Rate rfy/cvr
    Ähnliche Inhalte Conversion-Rate mlt/cvr
    Beliebt Conversion-Rate mp/cvr
    Was Ihnen sonst noch gefallen könnte Beobachtungszeitraum pro Sitzung oyml/wdps
    Empfehlungen für mich Beobachtungszeitraum pro Sitzung rfy/wdps
    Ähnliche Inhalte Beobachtungszeitraum pro Sitzung mlt/wdps

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" \
    -H "X-GFE-SSL: yes" \
    -H "X-Goog-User-Project: PROJECT_ID" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/requirements:checkRequirement" \
    -d '{
          "location": "projects/PROJECT_ID/locations/global",
          "requirementType": "discoveryengine.googleapis.com/media_recs/MODEL_OBJ/warning",
          "resources": [
            {
              "labels": {
                "branch_id": "0",
                "collection_id": "default_collection",
                "datastore_id": "DATA_STORE_ID",
                "location_id": "global",
                "project_number": "PROJECT_ID"
              },
              "type": "discoveryengine.googleapis.com/Branch"
            },
            {
              "labels": {
                "collection_id": "default_collection",
                "datastore_id": "DATA_STORE_ID",
                "location_id": "global",
                "project_number": "PROJECT_ID"
              },
              "type": "discoveryengine.googleapis.com/DataStore"
            }
          ]
        }'
    
    • PROJECT_ID ist die ID Ihres Google Cloud-Projekts.
    • DATA_STORE_ID: die ID des Vertex AI Search-Datenspeichers.
    • MODEL_OBJ: In der Tabelle oben finden Sie den richtigen Wert für Ihre Empfehlungs-App.
  5. Sehen Sie sich die Ausgabe an:

    1. Suchen Sie den Wert von result:

      • Wenn der Wert SUCCESS ist, sind Ihre Daten ausreichend.

      • Wenn der Wert WARNING ist, fahren Sie mit Schritt b fort.

      • Wenn result in der Ausgabe nicht angezeigt wird, kann das mehrere Gründe haben:

        • PROJECT_ID oder DATA_STORE_ID in der Anfrage ist falsch.

        • Einige Messwerte sind nicht verfügbar. Versuchen Sie es in sechs Stunden noch einmal oder wenden Sie sich an einen Kundenservicemitarbeiter.

    2. Sehen Sie sich den Ausdruck (requirement.Condition.Expression) an. Wenn dieser Ausdruck als falsch ausgewertet wird, liegt ein Problem mit Ihren Daten vor.

      Die Werte der Messwerte finden Sie im Feld requirementCondition.metricResults.value und die Werte für den Warngrenzwert in den Feldern thresholdBindings.thresholdValues. Die Felder description können Ihnen helfen, den Zweck des Messwerts zu verstehen.