Verificar a qualidade dos dados para receber recomendações de mídia

Esta página descreve como chamar o método de verificação de requisitos que retorna informações sobre se as diversas métricas dos seus dados de mídia atendem aos requisitos de conformidade.

Sobre a verificação da qualidade dos dados de mídia

Como os eventos recentes do usuário são muito importantes para as recomendações de mídia, é necessário verificar regularmente a qualidade dos dados ingeridos e dos eventos do usuário. Você pode fazer isso executando o método de verificação de requisitos no repositório de dados de mídia.

Se o limite de uma métrica não for atendido, o comando curl vai gerar um aviso. Depois, é preciso analisar a métrica e a descrição dela para determinar qual ação que você deve seguir para melhorar a qualidade da mídia.

Todos os modelos e objetivos precisam ultrapassar os limites de métricas gerais. Alguns modelos têm métricas e limites adicionais e exigem que você execute uma na segunda verificação de requisitos.

Para mais informações sobre os modelos e objetivos de recomendação, consulte Sobre os tipos de recomendações de apps de música.

Verificar a qualidade dos dados

Use o método requirements:checkRequirement para verificar a qualidade dos dados de recomendações de mídia, como mostrado a seguir.

REST

Para verificar a qualidade na linha de comando, siga estas etapas:

  1. Encontre o ID do repositório de dados. Se você já tem seu repositório de dados ID, pule para a próxima etapa.

    1. No console do Google Cloud, acesse a página Criador de agentes e, no menu de navegação, clique em Repositórios de dados.

      Acessar a página "Repositórios de dados"

    2. Clique no nome do seu repositório de dados.

    3. Na página Dados do seu repositório de dados, encontre o ID do repositório.

  2. Execute o seguinte comando curl para saber se suas recomendações de mídia atendem aos requisitos os limites para as métricas gerais:

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" \
    -H "X-GFE-SSL: yes" \
    -H "X-Goog-User-Project: PROJECT_ID" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/requirements:checkRequirement" \
    -d '{
          "location": "projects/PROJECT_ID/locations/global",
          "requirementType": "discoveryengine.googleapis.com/media_recs/general/all/warning",
          "resources": [
            {
              "labels": {
                "branch_id": "0",
                "collection_id": "default_collection",
                "datastore_id": "DATA_STORE_ID",
                "location_id": "global",
                "project_number": "PROJECT_ID"
              },
              "type": "discoveryengine.googleapis.com/Branch"
            },
            {
              "labels": {
                "collection_id": "default_collection",
                "datastore_id": "DATA_STORE_ID",
                "location_id": "global",
                "project_number": "PROJECT_ID"
              },
              "type": "discoveryengine.googleapis.com/DataStore"
            }
          ]
        }'
    
    • PROJECT_ID: o ID do seu projeto do Google Cloud.
    • DATA_STORE_ID: o ID do repositório de dados da Vertex AI para Pesquisa.
  3. Confira a saída:

    1. Procure o valor de requirementResult:

      • Se o valor for SUCCESS, seus dados atendem aos requisitos gerais. Continue para a etapa 4.

      • Se o valor for WARNING, continue para a etapa b.

      • Se você não encontrar requirementResult na saída, há alguns motivos possíveis:

        • O PROJECT_ID ou DATA_STORE_ID na solicitação está incorreto.

        • Alguns valores de métricas não estão disponíveis. Tente de novo em 6 horas ou entre em contato com um engenheiro de clientes para receber ajuda.

    2. Procure a expressão (requirement.Condition.Expression): se este expressão for avaliada como falsa, há um problema com seus dados.

      O valor das métricas está no requirementCondition.metricResults.value. Os valores do limite de alerta estão nos campos MetricBindings.warningThreshold. Os campos description podem ajudar a entender a finalidade da métrica.

      Por exemplo, o valor de doc_with_same_title_percentage é 30.47 e o limite de aviso para doc_with_same_title_percentage_threshold é 1. Há um problema de dados que muitos dos títulos no repositório de dados são iguais, e isso precisa ser investigado.

  4. Se a combinação de modelo e objetivo usada para seu app de recomendações aparecer nessa tabela, você também precisará chamar o requisito de verificação , atualizado com os valores do seu modelo e objetivo:

    Modelo Objetivo MODEL_OBJ
    Outros itens que você pode gostar Taxa de conversão oyml/cvr
    Recomendados para você Taxa de conversão rfy/cvr
    Mais conteúdo semelhante Taxa de conversão mlt/cvr
    Mais popular Taxa de conversão mp/cvr
    Outros itens que você pode gostar Duração da exibição por sessão. oyml/wdps
    Recomendados para você Duração da exibição por sessão. rfy/wdps
    Mais conteúdo semelhante Duração da exibição por sessão. mlt/wdps

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" \
    -H "X-GFE-SSL: yes" \
    -H "X-Goog-User-Project: PROJECT_ID" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/requirements:checkRequirement" \
    -d '{
          "location": "projects/PROJECT_ID/locations/global",
          "requirementType": "discoveryengine.googleapis.com/media_recs/MODEL_OBJ/warning",
          "resources": [
            {
              "labels": {
                "branch_id": "0",
                "collection_id": "default_collection",
                "datastore_id": "DATA_STORE_ID",
                "location_id": "global",
                "project_number": "PROJECT_ID"
              },
              "type": "discoveryengine.googleapis.com/Branch"
            },
            {
              "labels": {
                "collection_id": "default_collection",
                "datastore_id": "DATA_STORE_ID",
                "location_id": "global",
                "project_number": "PROJECT_ID"
              },
              "type": "discoveryengine.googleapis.com/DataStore"
            }
          ]
        }'
    
    • PROJECT_ID: o ID do seu projeto do Google Cloud.
    • DATA_STORE_ID: o ID do repositório de dados da Vertex AI para Pesquisa.
    • MODEL_OBJ: consulte a tabela anterior para escolher o valor correto para seu app de recomendações.
  5. Confira o resultado:

    1. Procure o valor de requirementResult:

      • Se o valor for SUCCESS, seus dados são suficientes.

      • Se o valor for WARNING, continue para a etapa b.

      • Se você não encontrar requirementResult na saída, há alguns motivos possíveis:

        • O PROJECT_ID ou DATA_STORE_ID na solicitação está incorreto.

        • Alguns valores de métricas não estão disponíveis. Tente de novo em seis horas ou entre em contato com um engenheiro de atendimento ao cliente para receber ajuda.

    2. Procure a expressão (requirement.Condition.Expression). Se esse expressão for avaliada como falsa, há um problema com seus dados.

      O valor das métricas pode ser encontrado no arquivo requirementCondition.metricResults.value, e o limite de aviso nos campos MetricBindings.warningThreshold. Os campos description podem ajudar você a entender a finalidade da métrica.