Ler de uma tabela do SQL Server


Nesta página, descrevemos como configurar seu pipeline de dados para ler dados de uma tabela do Microsoft SQL Server.

Antes de começar

  1. Faça login na sua conta do Google Cloud. Se você começou a usar o Google Cloud agora, crie uma conta para avaliar o desempenho de nossos produtos em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.
  2. No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.

    Acessar o seletor de projetos

  3. Verifique se a cobrança está ativada para o seu projeto do Google Cloud.

  4. No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.

    Acessar o seletor de projetos

  5. Verifique se a cobrança está ativada para o seu projeto do Google Cloud.

  6. Ative as APIs Cloud Data Fusion, BigQuery, Cloud Storage, and Dataproc.

    Ative as APIs

  7. Crie uma instância do Cloud Data Fusion.
  8. O banco de dados do SQL Server precisa aceitar conexões do Cloud Data Fusion. Por motivos de segurança, use uma instância particular do Cloud Data Fusion.

Abra sua instância do Cloud Data Fusion.

  1. No console do Google Cloud, acesse a página Instâncias do Cloud Data Fusion.

    Acesse "Instâncias"

  2. Na coluna Ações da instância, clique em Ver instância para abrir a instância no Cloud Data Fusion.

Armazenar a senha do SQL Server como uma chave segura

Adicione sua senha do SQL Server como uma chave segura na instância do Cloud Data Fusion.

  1. No Cloud Data Fusion, clique em Administrador do sistema.

  2. Clique na guia Configuração.

  3. Clique em Fazer chamadas HTTP.

    Configuration do HBase.

  4. Selecione PUT.

  5. No campo de caminho, insira namespaces/NAMESPACE_ID/securekeys/password .

  6. No campo Corpo, digite {"data":"password"}. Substitua password pela sua senha do SQL Server.

  7. Clique em Send.

    Senha.

A Resposta precisa ter o código de status 200 para continuar.

Acessar o driver JDBC para SQL Server

É possível acessar o driver no Hub ou no Pipeline Studio no Cloud Data Fusion.

Hub

  1. Na IU do Cloud Data Fusion, clique em Hub.

  2. Na barra de pesquisa, digite SQL Server JDBC Driver e selecione o motorista.

  3. Clique em Fazer download. Siga as etapas de download mostradas.

  4. Selecione Implantar. Faça upload do arquivo JAR da etapa anterior.

  5. Clique em Finish.

Pipeline Studio

  1. Acesse Microsoft.com.

  2. Escolha o download e clique em Fazer o download.

  3. No Cloud Data Fusion, clique em Menu e acesse a página Pipeline Studio.

  4. Clique em Adicionar.

  5. No driver, clique em Upload.

  6. Selecione o arquivo JAR, localizado na pasta jre7.

  7. Clique em Próxima.

  8. Para configurar o driver, insira um Nome e um Nome de classe.

  9. Clique em Finish.

Implantar o plug-in do SQL Server

  1. No Cloud Data Fusion, clique em Hub.

  2. Na barra de pesquisa, digite SQL Server Plugins.

  3. Clique em Plug-ins do servidor SQL.

  4. Selecione Implantar.

  5. Clique em Finish.

  6. Clique em Criar um pipeline.

Conectar-se ao SQL Server

É possível se conectar ao SQL Server pelo Cloud Data Fusion no Wrangler ou no Pipeline Studio.

Wrangler

  1. No Cloud Data Fusion, clique em Menu e acesse a página Wrangler.

  2. Clique em Adicionar conexão.

    A janela Adicionar conexão vai ser aberta.

  3. Clique em SQL Server para verificar se o driver está instalado.

    Upload do JAR realizado.

  4. Insira os detalhes nos campos de conexão obrigatórios. No campo Senha, selecione a chave segura armazenada anteriormente. Ele garante que sua senha seja recuperada usando o Cloud KMS.

    Escolher a senha.

  5. Para verificar se é possível estabelecer uma conexão com o banco de dados, clique em Testar conexão.

  6. Clique em Adicionar conexão.

Depois que o banco de dados do SQL Server estiver conectado e você criar um pipeline que lê a tabela do SQL Server, será possível aplicar transformações e gravar sua saída em um coletor.

Pipeline Studio

  1. Abra sua instância do Cloud Data Fusion e acesse a página Pipeline Studio.

  2. Expanda o menu Origem e clique em SQL Server.

    SQL Server

  3. No nó do SQL Server, clique em Propriedades.

    Propriedades
  4. No campo Nome da referência, insira um nome que identifique a origem do SQL Server.

  5. No campo Banco de dados, insira o nome do banco de dados a ser conectado.

  6. No campo Importar consulta, insira a consulta a ser executada. Por exemplo, SELECT * FROM table WHERE $CONDITIONS.

  7. Clique em Validate (Validar).

  8. Clique em Fechar .

Depois que o banco de dados do SQL Server estiver conectado e você criar um pipeline que lê a tabela do SQL Server, adicione as transformações desejadas e grave a saída em um coletor.

A seguir