Importer les données de saisie semi-automatique pour la recherche

La saisie semi-automatique est une fonctionnalité qui prédit le reste du mot saisi par l'utilisateur. ce qui peut améliorer l'expérience de recherche des utilisateurs. Cette fonctionnalité peut fournir des suggestions basées sur l'ensemble de données ou sur les événements utilisateur que vous lui fournissez.

N'importez des données de saisie semi-automatique que si vous souhaitez disposer (liste à ne pas supprimer, liste de refus) ou si vous devez utiliser les vôtres de saisie semi-automatique Google. L'activation de l'apprentissage automatique est suffisante dans la plupart des cas. où la saisie semi-automatique est nécessaire. L'apprentissage automatique fournit Ensemble de données de suggestions basées sur l'apprentissage basé sur les événements de recherche des utilisateurs. Voir Saisie semi-automatique pour savoir comment activer l'apprentissage automatique.

Ces instructions concernent l'importation de votre propre saisie semi-automatique données uniquement. Maintenez-le à jour si vous prévoyez d'utiliser la saisie semi-automatique ensemble de données. Pour obtenir les résultats de la saisie semi-automatique au moment de la requête, reportez-vous à CompletionService.CompleteQuery. Les données de saisie semi-automatique sont utilisé uniquement pour la recherche. Ces données ne sont pas utilisées par recommandations.

Avant de commencer

Avant de pouvoir importer vos informations de saisie semi-automatique, vous devez avoir terminé suivez les instructions de la section Avant de commencer, en particulier configurer votre projet, créer un compte de service ; en ajoutant le compte de service à votre environnement local.

Vous devez disposer du rôle IAM Éditeur Retail pour effectuer l'importation.

Bonnes pratiques pour l'importation de la saisie semi-automatique

Lorsque vous importez des données de saisie semi-automatique, veillez à implémenter pratiques:

  • Lisez le schéma BigQuery présenté ci-dessous. et la documentation de l'API.

  • N'utilisez pas de valeurs d'espace réservé.

  • Incluez autant de champs que possible.

  • Maintenez votre propre ensemble de données de saisie semi-automatique à jour si vous prévoyez d'en utiliser l'ensemble de données importé.

  • L'importation de données depuis un autre projet n'est pas autorisée.

Importer les données de saisie semi-automatique

Importer des données de saisie semi-automatique depuis BigQuery

Vertex AI Search pour le commerce accepte l'importation de données BigQuery pour Deny Liste, Liste à ne pas supprimer et Liste de termes suggérés. Pour en savoir plus, consultez Saisie semi-automatique :

Pour importer des données de saisie semi-automatique au format correct depuis BigQuery, utilisez la Schéma de saisie semi-automatique de Vertex AI Search pour le commerce pour créer une table BigQuery en utilisant le format approprié ; charger la table avec vos données de saisie semi-automatique. Ensuite, importez votre vers Vertex AI Search pour le commerce.

Pour plus d'informations sur les tables BigQuery, consultez la page Présentation des tables. Pour obtenir de l'aide sur les requêtes BigQuery, consultez la page Présentation des requêtes de données dans BigQuery.

Emplacement de l'ensemble de données BigQuery

Lorsque vous créez votre ensemble de données BigQuery de saisie semi-automatique dans les tables BigQuery, assurez-vous que l'ensemble L'emplacement est défini sur l'emplacement multirégional "US". Ne la configure pas correctement entraîne l'échec de votre requête d'importation. Pour en savoir plus sur pour les emplacements des ensembles de données BigQuery, consultez les emplacements des ensembles de données dans BigQuery ; dans la documentation Google Cloud.

Insérer les données dans BigQuery

Utilisez le schéma de saisie semi-automatique de Vertex AI Search pour le commerce pour : importer les données de saisie semi-automatique dans BigQuery ;

BigQuery peut utiliser le schéma pour vérifier si les données au format JSON présentent des noms et des types de champ corrects (tels que STRING, INTEGER et RECORD), mais n'est pas capable de vérifier :

  • Si un champ de chaîne est mappé sur une valeur d'énumération reconnaissable.
  • Si un champ de chaîne utilise le format approprié.
  • Si la valeur d'un champ de type entier ou nombre à virgule flottante se situe dans une plage valide.
  • Si un champ manquant est un champ obligatoire.

Pour garantir la qualité de vos données et de l'expérience de recherche des utilisateurs finaux, veillez à vous reporter au schéma et à la documentation de référence pour plus de détails sur les valeurs et sur les formats à utiliser.

Configurer l'accès à votre ensemble de données BigQuery

Pour configurer l'accès, assurez-vous que votre ensemble de données BigQuery se trouve dans le le même projet que votre service Vertex AI Search pour le commerce et effectuez les opérations suivantes : étapes.

  1. Ouvrez la page "IAM" dans Google Cloud Console.

    Ouvrir la page IAM

  2. Sélectionnez votre projet Vertex AI Search pour le commerce.

  3. Sur la page IAM et Admin, cliquez sur  Accorder l'accès.

  4. Dans le champ Nouveaux comptes principaux, saisissez cloud-retail-customer-data-access@system.gserviceaccount.com, puis sélectionnez BigQuery > Lecteur de données BigQuery.

    Si vous ne souhaitez pas attribuer le rôle de lecteur de données sur l'ensemble du projet, vous pouvez l'ajouter directement au niveau de l'ensemble de données. En savoir plus

  5. Cliquez sur Enregistrer.

Déclencher l'importation de données dans Vertex AI Search pour le commerce

Console

  1. Accéder à la page "Contrôles"

  2. Accédez à l'onglet Commandes de saisie semi-automatique.

  3. Dans la section Listes de termes, trouvez le type de liste que vous prévoyez d'importer. (Liste de refus, Liste à ne pas supprimer ou Liste de termes suggérés) et cliquez sur Importer ou Remplacer.

    Le volet Importer s'ouvre.

  4. Saisissez le chemin d'accès BigQuery de votre emplacement de données ou sélectionnez Parcourir pour sélectionner l'emplacement

    Le chemin d'accès BigQuery doit se trouver dans le même projet et dans son le schéma doit être correct. Pour le vérifier, cliquez sur Parcourir, puis sur le bouton nom de la table pour afficher son contenu dans la console BigQuery.

  5. Dans le volet Importer, cliquez sur Importer.

    L'importation commence. Vous pouvez quitter la page sans interrompre l'importation.

cURL

  1. Créez un fichier de données pour les paramètres d'entrée de l'importation. Les valeurs de vos paramètres d'entrée varient selon que vous importez depuis Cloud Storage ou BigQuery.

    Utilisez l'objet BigQuerySource pour pointer vers votre ensemble de données BigQuery.

    {
      "inputConfig":{
        "bigQuerySource": {
          "datasetId":"dataset-id",
          "tableId":"table-id",
          "dataSchema":"data-schema"
        }
      }
    }
    
  2. Importez vos informations de saisie semi-automatique dans Vertex AI Search pour le commerce en en envoyant une requête POST au CompletionData:import, qui fournit la nom du fichier de données (représenté par input.json dans l'exemple ci-dessous).

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" -d @./input.json
    "https://retail.googleapis.com/v2alpha/projects/PROJECT_NUMBER/locations/global/catalogs/default_catalog/completionData:import"
    

    Vous pouvez vérifier l'état de manière automatisée avec l'API. Vous devriez recevoir un objet de réponse ressemblant à ceci :

    {
      "name": "projects/PROJECT_ID/locations/global/catalogs/default_catalog/operations/123456",
      "done": false
    }
    

    Le champ de nom est l'ID de l'objet d'opération. À demander l'état de cet objet, remplacez le champ "name" par le renvoyée par la méthode d'importation. Une fois l'importation terminée, Le champ done renvoie true:

    curl -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    "https://retail.googleapis.com/v2alpha/projects/PROJECT_ID/locations/global/catalogs/default_catalog/operations/123456"
    

    Une fois l'opération terminée, l'objet renvoyé a une valeur done de true et inclut un objet Status semblable à l'exemple suivant :

    {
      "name": "projects/PROJECT_ID/locations/global/catalogs/default_catalog/operations/123456",
      "metadata": {
        "@type": "type.googleapis.com/google.cloud.retail.v2alpha.ImportMetadata",
        "createTime": "2020-01-01T03:33:33.000001Z",
        "updateTime": "2020-01-01T03:34:33.000001Z",
        "successCount": "2",
        "failureCount": "1"
      },
      "done": true
      "response": {
        "@type": "type.googleapis.com/google.cloud.retail.v2alpha.ImportCompletionDataResponse",
      }
    }
    

Format des données de saisie semi-automatique

Votre fichier JSON doit ressembler aux exemples suivants. Les sauts de ligne ne sont là que pour des raisons de lisibilité. Vous devez fournir une suggestion entière sur une seule ligne. Chaque suggestion doit figurer sur une ligne distincte.

Champs obligatoires pour la suggestion :

{
  "suggestion": "ABC",
  "globalScore": "0.5"
}

ou

{
  "suggestion": "ABC",
  "frequency": "100"
}

Durée de l'importation des données de saisie semi-automatique

L'importation prend généralement de quelques minutes à une heure BigQuery pour terminer.

Une fois l'importation de l'ensemble de données terminée, le champ done de la section objet d'opération est marqué comme vrai. Ensuite, l'indexation et l'utilisation des données peuvent prendre un à deux jours supplémentaires. dans l'inférence en production.

Maintenir votre ensemble de données de saisie semi-automatique à jour

Si vous prévoyez d'utiliser votre propre ensemble de données importé, il est recommandé de maintenir régulièrement l'ensemble de données importé à jour.

Mise à jour groupée

Vous pouvez utiliser la méthode d'importation pour mettre à jour la saisie semi-automatique de manière groupée. À faire de la même manière que l'importation initiale. suivez les étapes décrites dans Importer des données de saisie semi-automatique Cette action remplacera l'intégralité de l'ensemble de données importé.

Surveiller l'état des importations

Pour toujours obtenir des suggestions de haute qualité lorsque vous utilisez la saisie semi-automatique, il est important de maintenir votre ensemble de données à jour. Vous devez surveiller les taux d'erreur d'importation et prendre des mesures, le cas échéant.

Schéma de saisie semi-automatique Vertex AI Search pour le commerce

Lorsque vous importez un ensemble de données de saisie semi-automatique depuis BigQuery, utilisez la le schéma Vertex AI Search pour le commerce ci-dessous afin de créer les tables BigQuery au bon format et les charger avec les données de saisie semi-automatique.

Schéma des suggestions

Cet ensemble de données est utilisé pour fournir vos propres suggestions de saisie semi-automatique avec vos propres scores.

Schéma de la liste de blocage

Cet ensemble de données est utilisé comme liste de blocage pour empêcher la suggestion de certaines expressions.

Schéma de la liste d'autorisation

Cet ensemble de données est utilisé pour ignorer les processus post-processus (tels que la correction orthographique et un filtrage sans résultat) pour toutes les expressions de cette liste d'autorisation.