Sincronize a partir do Cloud SQL

Para carregar dados do Cloud SQL, siga os passos abaixo para configurar o acesso ao Cloud SQL, criar um repositório de dados e carregar dados.

Configure o acesso ao contentor de preparação para instâncias do Cloud SQL

Quando carrega dados do Cloud SQL, os dados são primeiro preparados num contentor do Cloud Storage. Siga estes passos para conceder a uma instância do Cloud SQL acesso a contentores do Cloud Storage.

  1. Na Google Cloud consola, aceda à página SQL.

    SQL

  2. Clique na instância do Cloud SQL a partir da qual planeia importar.

  3. Copie o identificador da conta de serviço da instância, que se assemelha a um endereço de email, por exemplo, p9876-abcd33f@gcp-sa-cloud-sql..

  4. Aceda à página IAM e administrador.

    IAM e administrador

  5. Clique em Conceder acesso.

  6. Para Novos membros, introduza o identificador da conta de serviço da instância e selecione a função Cloud Storage > Administrador de armazenamento.

  7. Clique em Guardar.

Seguinte:

Configure o acesso ao Cloud SQL a partir de um projeto diferente

Para conceder ao Gemini Enterprise acesso a dados do Cloud SQL que se encontram num projeto diferente, siga estes passos:

  1. Substitua a seguinte variável PROJECT_NUMBER pelo número do seu projeto do Gemini Enterprise e, de seguida, copie o conteúdo do bloco de código. Este é o identificador da sua conta de serviço do Gemini Enterprise:

    service-PROJECT_NUMBER@gcp-sa-discoveryengine.
    
  2. Aceda à página IAM e administrador.

    IAM e administrador

  3. Mude para o seu projeto do Cloud SQL na página IAM e administrador e clique em Conceder acesso.

  4. Para Novos membros, introduza o identificador da conta de serviço e selecione a função Cloud SQL > Leitor do Cloud SQL.

  5. Clique em Guardar.

Em seguida, aceda a Importar dados do Cloud SQL.

Importe dados do Cloud SQL

Consola

Para usar a consola para carregar dados do Cloud SQL, siga estes passos:

  1. Na Google Cloud consola, aceda à página Gemini Enterprise.

    Gemini Enterprise

  2. Aceda à página Armazenamentos de dados.

  3. Clique em Criar arquivo de dados.

  4. Na página Selecione uma origem de dados, selecione Cloud SQL.

  5. Especifique o ID do projeto, o ID da instância, o ID da base de dados e o ID da tabela dos dados que planeia importar.

  6. Clique em Procurar e escolha uma localização intermédia do Cloud Storage para exportar os dados e, de seguida, clique em Selecionar. Em alternativa, introduza a localização diretamente no campo gs://.

  7. Selecione se quer ativar a exportação sem servidor. A exportação sem servidor incorre em custos adicionais. Para obter informações sobre a exportação sem servidor, consulte o artigo Minimize the performance impact of exports (Minimize o impacto no desempenho das exportações) na documentação do Cloud SQL.

  8. Clique em Continuar.

  9. Escolha uma região para o seu repositório de dados.

  10. Introduza um nome para o arquivo de dados.

  11. Clique em Criar.

  12. Para verificar o estado do carregamento, aceda à página Armazenamentos de dados e clique no nome do armazenamento de dados para ver os respetivos detalhes na página Dados. Quando a coluna de estado no separador Atividade muda de Em curso para Importação concluída, a ingestão está concluída.

    Consoante o tamanho dos seus dados, a carregamento pode demorar vários minutos ou várias horas.

REST

Para usar a linha de comandos para criar um repositório de dados e carregar dados do Cloud SQL, siga estes passos:

  1. Crie um repositório de dados.

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json" \
    -H "X-Goog-User-Project: PROJECT_ID" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores?dataStoreId=DATA_STORE_ID" \
    -d '{
      "displayName": "DISPLAY_NAME",
      "industryVertical": "GENERIC",
      "solutionTypes": ["SOLUTION_TYPE_SEARCH"],
    }'
    

    Substitua o seguinte:

    • PROJECT_ID: o ID do seu projeto.
    • DATA_STORE_ID: o ID do armazenamento de dados. O ID só pode conter letras minúsculas, dígitos, sublinhados e hífenes.
    • DISPLAY_NAME: o nome a apresentar da loja de dados. Isto pode ser apresentado na Google Cloud consola.
  2. Importe dados do Cloud SQL.

      curl -X POST \
      -H "Authorization: Bearer $(gcloud auth print-access-token)" \
      -H "Content-Type: application/json" \
      "https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/documents:import" \
      -d '{
        "cloudSqlSource": {
          "projectId": "SQL_PROJECT_ID",
          "instanceId": "INSTANCE_ID",
          "databaseId": "DATABASE_ID",
          "tableId": "TABLE_ID",
          "gcsStagingDir": "STAGING_DIRECTORY"
        },
        "reconciliationMode": "RECONCILIATION_MODE",
        "autoGenerateIds": "AUTO_GENERATE_IDS",
        "idField": "ID_FIELD",
      }'
    

    Substitua o seguinte:

    • PROJECT_ID: o ID do seu projeto do Gemini Enterprise.
    • DATA_STORE_ID: o ID do armazenamento de dados. O ID só pode conter letras minúsculas, dígitos, sublinhados e hífenes.
    • SQL_PROJECT_ID: o ID do seu projeto do Cloud SQL.
    • INSTANCE_ID: o ID da sua instância do Cloud SQL.
    • DATABASE_ID: o ID da sua base de dados do Cloud SQL.
    • TABLE_ID: o ID da sua tabela do Cloud SQL.
    • STAGING_DIRECTORY: opcional. Um diretório do Cloud Storage, por exemplo, gs://<your-gcs-bucket>/directory/import_errors.
    • RECONCILIATION_MODE: opcional. Os valores são FULL e INCREMENTAL. A predefinição é INCREMENTAL. A especificação de INCREMENTAL provoca uma atualização incremental dos dados do Cloud SQL para o seu repositório de dados. Esta ação faz uma operação de inserção/atualização, que adiciona novos documentos e substitui os documentos existentes por documentos atualizados com o mesmo ID. A especificação de FULL provoca uma nova base completa dos documentos no seu repositório de dados. Por outras palavras, os documentos novos e atualizados são adicionados ao seu repositório de dados, e os documentos que não estão no Cloud SQL são removidos do seu repositório de dados. O modo FULL é útil se quiser eliminar automaticamente documentos de que já não precisa.

Passos seguintes

  • Para anexar o seu arquivo de dados a uma app, crie uma app e selecione o seu arquivo de dados seguindo os passos em Crie uma app de pesquisa.

  • Para pré-visualizar a apresentação dos resultados da pesquisa após a configuração da app e do arquivo de dados, consulte o artigo Pré-visualizar resultados da pesquisa.