Criar uma instância particular com peering de VPC

Nesta página, descrevemos como criar uma instância do Cloud Data Fusion com uma endereço IP interno. Você cria a instância em um rede VPC ou uma Rede VPC compartilhada.

Uma instância particular do Cloud Data Fusion tem os seguintes benefícios:

  • As conexões com a instância são estabelecidas por uma rede VPC particular no seu projeto do Google Cloud. O tráfego pela rede não passa pela Internet pública.

  • A instância pode se conectar aos recursos no local, como porque sua rede no local se conecta ao rede VPC privada do Google Cloud usando Cloud VPN ou Cloud Interconnect: Você pode acessar com segurança seus recursos locais, como bancos de dados, por a rede privada sem abrir o acesso ao Google Cloud.

Objetivos

  • Configure a rede VPC ou a rede VPC compartilhada.
  • Aloque um intervalo de IP que será usado para implantar o Cloud Data Fusion no projeto de locatário.
  • Criar a instância particular do Cloud Data Fusion.
  • Configure o peering de rede VPC entre a VPC que que contém a instância do Cloud Data Fusion e a VPC que que contém o projeto de locatário associado.
  • Para redes VPC compartilhadas, configure o Identity and Access Management (IAM) permissões.
  • Se a instância particular usar o Cloud Data Fusion versão 6.2.0 ou antes, crie uma regra de firewall.
  • Permitir que diferentes serviços do Google Cloud se comuniquem internamente entre si ativando o Acesso privado do Google sub-rede do Dataproc.

Antes de começar

  • Para saber mais sobre a arquitetura de implantação do Cloud Data Fusion, consulte Rede.

Configurar a rede VPC

Crie uma rede VPC, se ainda não tiver feito isso. ou uma rede VPC compartilhada.

Para configurar sua rede VPC, você precisa alocar um endereço IP do intervalo 10.240.0.0/16.

Aloque um intervalo de IP

Rede VPC

Se você não estiver usando uma rede VPC compartilhada, O Cloud Data Fusion aloca um intervalo de IP por padrão quando você cria um instância.

Rede VPC compartilhada

Para usar uma VPC compartilhada, você precisa alocar um endereço IP da instância do Cloud Data Fusion.

Para alocar um intervalo de IP para sua instância do Cloud Data Fusion, siga estas instruções: estas etapas:

  1. No Console do Google Cloud, acesse a página Redes VPC.

    Acessar redes VPC

  2. Na coluna Nome, clique na rede VPC em que você quer criar uma instância particular do Cloud Data Fusion.

    A página Detalhes da rede VPC é aberta.

  3. Clique em Conexão de serviço privado. Se solicitado, ative API Service Networking clicando em Ativar API.

    Configurar os detalhes da rede VPC.

  4. Clique em Alocar intervalo de IP.

    1. Dê um nome ao intervalo de IP.

    2. Em Intervalo de IP, clique em Automático.

    3. Especifique um tamanho de prefixo 22.

    4. Clique em Alocar.

      Aloque um intervalo de IP.

Criar uma instância particular

Crie a instância particular do Cloud Data Fusion em uma VPC de rede ou uma rede VPC compartilhada.

Rede VPC

Para criar a instância em uma rede VPC, use o console do Google Cloud ou cURL.

Se você usa o console do Google Cloud para criar sua instância particular, O Cloud Data Fusion aloca o intervalo de endereços IP /22 por padrão. Para escolha um intervalo de IP diferente, use o comando cURL.

Console

  1. Acesse a página Criar instância do Data Fusion.

    Acesse "Criar instância do Data Fusion"

  2. Insira um nome e uma descrição para sua instância.

  3. Selecione a Região em que a instância será criada.

  4. Selecione uma versão do Cloud Data Fusion. Edição.

  5. Especifique o Conta de serviço do Dataproc para executar o pipeline do Cloud Data Fusion o Dataproc. O padrão do Compute Engine está pré-selecionada.

  6. Expanda o menu Opções avançadas e clique em Ativar IP privado.

  7. No campo Rede, escolha uma rede para criar a instância.

  8. Clique em Criar. O processo de criação da instância leva até 30 minutos para ser concluído.

cURL

Para sua conveniência, é possível exportar as variáveis a seguir ou substitua diretamente esses valores nos seguintes comandos:

export PROJECT=PROJECT_ID
export LOCATION=REGION
export DATA_FUSION_API_NAME=datafusion.googleapis.com

Para criar a instância, chame create() :

curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" https://$DATA_FUSION_API_NAME/v1/projects/$PROJECT/locations/$LOCATION/instances?instance_id=INSTANCE_ID -X POST -d '{"description": "Private CDF instance created through REST.", "type": "ENTERPRISE", "privateInstance": true, "networkConfig": {"network": "NETWORK_NAME", "ipAllocation": "IP_RANGE"}}'

Substitua:

  • INSTANCE_ID: a string de ID que a nova instância receberá.
  • NETWORK_NAME: o nome do rede VPC em que você quer criar a rede instância.
  • IP_RANGE: o IP do intervalo alocado. Para encontrar o intervalo de IP na Console do Google Cloud, acesse Detalhes da rede VPC > Conexão de serviço particular > Intervalo de IP interno .

Rede VPC compartilhada

Para criar sua instância em uma rede VPC compartilhada, use cURL, não o console do Google Cloud.

cURL

Para sua conveniência, é possível exportar as seguintes variáveis. Como alternativa, substitua diretamente esses valores nas seguintes instruções comandos:

export PROJECT=PROJECT_ID
export LOCATION=REGION
export DATA_FUSION_API_NAME=datafusion.googleapis.com

Para criar a instância, chame o create() dela. :

curl -H "Authorization: Bearer $(gcloud auth print-access-token)" -H "Content-Type: application/json" https://$DATA_FUSION_API_NAME/v1/projects/$PROJECT/locations/$LOCATION/instances?instanceId=INSTANCE_ID -X POST -d '{"description": "Private CDF instance created through REST.", "type": "ENTERPRISE", "privateInstance": true, "networkConfig": {"network": "projects/SHARED_VPC_HOST_PROJECT_ID/global/networks/NETWORK_NAME", "ipAllocation": "IP_RANGE"}}'

Substitua:

  • INSTANCE_ID: a string de ID que a nova instância receberá.
  • SHARED_VPC_HOST_PROJECT_ID: o ID do projeto que está hospedando a rede VPC compartilhada.
  • NETWORK_NAME: o nome do rede VPC em que você quer criar a rede instância.
  • IP_RANGE: o intervalo de IP que você alocou. Para encontrar o intervalo de IP no console do Google Cloud, acesse Página Detalhes da rede VPC > Conexão de serviço particular > Intervalo de IP interno.
.

Configurar o peering de rede VPC

serviços do Cloud Data Fusion que você usa ambiente de design (por exemplo: Wrangler, Gerenciador de conexão e Validação do esquema) conexões de rede da VPC do projeto locatário para a rede sistemas. O Cloud Data Fusion usa Peering de rede VPC para estabelecer redes conectividade com a VPC ou VPC compartilhada que contém a instância. O peering de rede VPC permite que o Cloud Data Fusion acesse recursos em sua rede por endereços IP internos usando seus próprios e os controles da VPC. Para se conectar a um recurso em outro consulte as etapas para casos de uso de conexão.

A seção a seguir descreve como criar uma configuração de peering entre sua rede e o Cloud Data Fusion projeto de locatário em uma rede VPC.

Encontrar o ID do projeto de locatário

Para criar uma configuração de peering, você precisa do ID do projeto de locatário.

  1. Acesse a página Instâncias do Cloud Data Fusion.

    Acesse "Instâncias"

  2. Na coluna Nome da instância, selecione a instância.

  3. Na página Detalhes da instância, copie o ID do projeto de locatário, que é necessária para criar uma conexão de peering nas etapas a seguir.

Criar uma conexão de peering

  1. Acesse a página Peering de rede VPC.

    Acessar o peering de rede VPC

  2. Clique em Criar conexão > Continuar.

  3. Na página Criar conexão de peering, faça o seguinte:

    1. Digite um Nome para a conexão de peering.
    2. Em Sua rede VPC, selecione a rede que contém a instância do Cloud Data Fusion.
    3. Em Rede VPC com peering, selecione Em outro projeto.
    4. Em ID do projeto, insira ID do projeto de locatário que você encontrou anteriormente em neste tutorial.
    5. Em Nome da rede VPC, selecione uma rede ou insira INSTANCE_REGION a INSTANCE_ID.

      Substitua:

      • INSTANCE_REGION: a região em que você criou o instância do Cloud Data Fusion.
      • INSTANCE_ID: o ID da instância do Cloud Data Fusion.
      .
    6. Selecione a versão do Protocolo de Internet da conexão de peering trocar rotas IPv4 e IPv6 entre sua rede VPC e e a rede VPC com peering. Para mais informações, consulte Peering de rede VPC.

    7. Selecione Exportar rotas personalizadas para que rotas personalizadas podem ser exportadas da rede VPC para o locatário rede VPC do produtor de serviços.

    8. Escolha se você quer permitir a importação de rotas de sub-rede com IPv4 público ou exportados para sua rede VPC.

    9. Clique em Criar.

    O peering de rede VPC fica ativo logo após a criação.

Configurar permissões do IAM

Rede VPC

Pule esta etapa e acesse Criar uma regra de firewall.

Rede VPC compartilhada

Se você criar sua instância do Cloud Data Fusion em uma VPC compartilhada é preciso conceder o papel de usuário da rede do Compute para as contas de serviço a seguir. Para conceder permissões a todas as sub-redes, conceda o papel para o projeto host da VPC compartilhada.

Para controlar ainda mais o acesso, conceda o papel a uma sub-rede específica. o papel de Leitor de rede o projeto host.

  • Conta de serviço do Cloud Data Fusion: service-PROJECT_NUMBER@gcp-sa-datafusion.iam.gserviceaccount.com
  • Conta de serviço do Dataproc: service-PROJECT_NUMBER@dataproc-accounts.iam.gserviceaccount.com

PROJECT_NUMBER é o número do Projeto do Google Cloud que contém o Cloud Data Fusion instância.

Para mais informações, consulte Como conceder acesso. às contas de serviço necessárias.

Criar uma regra de firewall

Crie uma regra de firewall na rede VPC que permita conexões SSH de entrada do intervalo de IP especificado quando você criou a instância particular do Cloud Data Fusion.

Esta etapa é necessária para as versões do Cloud Data Fusion anteriores à 6.2.0. Ela permite a comunicação entre o Cloud Data Fusion e o Dataproc clusters que executam pipelines.

É possível criar a regra de firewall usando o console do Google Cloud ou usando a CLI gcloud.

Console

Consulte Como criar regras de firewall.

gcloud

Execute este comando:

gcloud compute firewall-rules create FIREWALL_NAME-allow-ssh --allow=tcp:22 --source-ranges=IP_RANGE --network=NETWORK_NAME --project=PROJECT_ID

Substitua:

  • FIREWALL_NAME: o nome da regra de firewall a criar.
  • IP_RANGE: o intervalo de IP que você alocada.
  • NETWORK_NAME: o nome da rede à qual em que a regra de firewall está anexada. É o nome da VPC rede em que você criou a instância particular.
  • PROJECT_ID: o ID do projeto que está hospedagem da rede VPC.

Etapas para casos de uso de conexão

As seções a seguir descrevem casos de uso relacionados à conexão para instâncias.

ativar o Acesso privado do Google

Para acessar recursos usando endereços IP internos, faça o seguinte: O Cloud Data Fusion precisa criar os clusters do Dataproc e executar aos pipelines de dados em uma sub-rede com Acesso privado do Google. Você deve ativar o Acesso privado do Google para a sub-rede que contém as clusters do Dataproc.

  • Se apenas uma sub-rede estiver presente na região em que o Dataproc Os clusters são iniciados, e eles são iniciados nessa sub-rede.
  • Se houver várias sub-redes em uma região, você precisará configurar o Cloud Data Fusion para selecionar a sub-rede com Acesso privado do Google para iniciar clusters do Dataproc.

Para ativar o Acesso privado do Google para a sub-rede, consulte Configuração do Acesso privado do Google.

Opcional: conectar a outras fontes

Depois de criar uma instância particular no Cloud Data Fusion, é possível se conectar a outras fontes, como os seguintes casos de uso:

Opcional: ativar peering de DNS

Ative o peering de DNS na seguintes casos:

  • Quando o Cloud Data Fusion se conecta a sistemas por nomes de host, e não por IP. endereços
  • Quando o sistema de destino é implantado por trás de um balanceador de carga, como acontece algumas implantações do SAP

A seguir