Esta página foi traduzida pela API Cloud Translation.

Resolver problemas do Cloud Data Fusion

Nesta página, você verá como resolver problemas com o Cloud Data Fusion.

Resolver problemas de pipelines em lote

O conselho a seguir é para pipelines em lote.

Erro de pipeline: arquivo de texto ocupado

O seguinte erro ocorre quando você executa um pipeline em lote, causando a falha:

error=26, Text file busy

Recomendação

Para resolver esse problema, configure um acionador que tente novamente automaticamente um pipeline quando ele falhar.

Interrompa o pipeline.
Crie um gatilho. Nesse caso, ao selecionar um evento para execução, escolha Falhas. Para mais informações, consulte Criar um gatilho de entrada em um pipeline de downstream.
Iniciar o pipeline.

O pipeline simultâneo está parado

No Cloud Data Fusion, a execução de muitos pipelines em lote simultâneos pode sobrecarregar a instância, fazendo com que os jobs fiquem presos nos estados Starting, Provisioning ou Running. Como resultado, os pipelines não podem ser interrompidos pela interface da Web ou chamadas de API. Quando você executa muitos pipelines simultaneamente, a interface da Web pode ficar lenta ou sem resposta. Esse problema ocorre devido a várias solicitações de interface feitas para o gerenciador HTTP no back-end.

Recomendação

Para resolver esse problema, controle o número de novas solicitações usando o controle de fluxo do Cloud Data Fusion, que está disponível nas instâncias em execução na versão 6.6 e mais recentes.

A conexão SSH atinge o tempo limite enquanto um pipeline está em execução

O seguinte erro ocorre quando você executa um pipeline em lote:

`java.io.IOException: com.jcraft.jsch.JSchException:
java.net.ConnectException: Connection timed out (Connection timed out)`

Recomendação

Para resolver o erro, verifique os seguintes problemas:

Verifique se há uma regra de firewall ausente (normalmente a porta 22). Para criar uma nova regra de firewall, consulte Configuração de rede de cluster do Dataproc.
Verifique se o Enforcer do Compute Engine permite a conexão entre a instância do Cloud Data Fusion e o cluster do Dataproc.

Código de resposta: 401. Erro: erro desconhecido

O seguinte erro ocorre quando você executa um pipeline em lote:

`java.io.IOException: Failed to send message for program run program_run:
Response code: 401. Error: unknown error`

Recomendação

Para resolver esse erro, conceda o papel de executor do Cloud Data Fusion (roles/datafusion.runner) à conta de serviço usada pelo Dataproc.

Falha no pipeline com o plug-in do BigQuery com erro `Access Denied`

Há um problema conhecido em que um pipeline falha com um erro Access Denied ao executar jobs do BigQuery. Isso afeta os pipelines que usam os seguintes plug-ins:

Origens do BigQuery
Coletores do BigQuery
Coletores de várias tabelas do BigQuery
Transformador pushdown

Exemplo de erros nos registros (pode variar conforme o plug-in que você está usando):

POST https://bigquery.googleapis.com/bigquery/v2/projects/PROJECT_ID/jobs
{
"code" : 403,
"errors" : [ {
"domain" : "global",
"message" : "Access Denied: Project xxxx: User does not have bigquery.jobs.create permission in project PROJECT_ID",
"reason" : "accessDenied"
} ],
"message" : "Access Denied: Project PROJECT_ID: User does not have bigquery.jobs.create permission in project PROJECT_ID.",
"status" : "PERMISSION_DENIED"
}

Neste exemplo, PROJECT_ID é o ID do projeto que você especificou no plug-in. A conta de serviço do projeto especificado no plug-in não tem permissão para realizar pelo menos uma das seguintes ações:

Executar um job do BigQuery
Ler um conjunto de dados do BigQuery
Criar um bucket temporário
Crie um conjunto de dados do BigQuery
Criar a tabela do BigQuery

Recomendação

Para resolver esse problema, conceda os papéis ausentes ao projeto (PROJECT_ID) que você especificou no plug-in:

Para executar um job do BigQuery, conceda o papel de usuário do job do BigQuery (roles/bigquery.jobUser).
Para ler um conjunto de dados do BigQuery, conceda o papel de leitor de dados do BigQuery (roles/bigquery.dataViewer).
Para criar um bucket temporário, conceda o papel de administrador de armazenamento (roles/storage.admin).
Para criar um conjunto de dados ou uma tabela do BigQuery, conceda o papel de editor de dados do BigQuery (roles/bigquery.dataEditor).

Para mais informações, consulte a documentação de solução de problemas do plug-in (Solução de problemas de coletores de várias tabelas do Google BigQuery).

O pipeline não para no limite de erros

Um pipeline pode não parar após vários erros, mesmo que você defina o limite de erro como 1.

O limite de erro é destinado a qualquer exceção gerada pela diretiva no caso de uma falha que não seja processada. Se a diretiva já usa a API emitError, o limite de erro não é ativado.

Recomendação

Para projetar um pipeline que falha quando um determinado limite é atendido, use a diretiva FAIL.

Sempre que a condição transmitida à diretiva FAIL for atendida, ela será contabilizada contra o limite de erro, e o pipeline falhará após o limite ser atingido.

O plug-in de origem de lote do Oracle converte `NUMBER` em `string`

Nas versões de origem em lote do Oracle 1.9.0, 1.8.3 e anteriores, o tipo de dados NUMBER do Oracle, com precisão e escala indefinidos, é mapeado para o tipo de dados decimal(38,0) do CDAP.

As versões 1.9.1, 1.8.4 e 1.8.5 do plug-in são incompatíveis com versões anteriores, e os pipelines que usam versões anteriores podem não funcionar após o upgrade para as versões 1.9.1, 1.8.5 e 1.8.4, caso um estágio downstream no pipeline dependa do esquema de saída da origem, porque o esquema de saída foi alterado. Quando há um esquema de saída definido para o tipo de dados NUMBER do Oracle definido sem precisão e escala na versão anterior do plug-in, após o upgrade para as versões 1.9.1, 1.8.5 ou 1.8.4, o plug-in de origem em lote do Oracle gera o seguinte erro de incompatibilidade de esquema para os tipos: Schema field '<field name>' is expected to have type 'decimal with precision <precision> and scale <scale> but found 'string'. Change the data type of field <field name> to string.

As versões 1.9.1, 1.8.5 e 1.8.4 vão funcionar com um esquema de saída do tipo de dados string CDAP para o tipo de dados NUMBER do Oracle definido sem precisão e escala. Se houver algum tipo de dados NUMBER do Oracle definido sem precisão e escala no esquema de saída de origem do Oracle, não é recomendável usar a versão mais antiga do plug-in do Oracle, porque isso pode causar erros de arredondamento.

O caso especial é quando você usa uma macro para o nome do banco de dados, o nome do esquema ou o nome da tabela, e se você não tiver especificado manualmente um esquema de saída. O esquema é detectado e mapeado no momento da execução. A versão mais antiga do plug-in de origem de lote do Oracle mapeia o tipo de dados NUMBER do Oracle definido sem precisão e escala para o tipo de dados decimal(38,0) do CDAP, enquanto as versões 1.9.1, 1.8.5 e 1.8.4 e mais recentes mapeiam os tipos de dados para string no momento da execução.

Recomendação

Para resolver o possível problema de perda de precisão ao trabalhar com tipos de dados NUMBER do Oracle com precisão e escala indefinidos, faça upgrade dos pipelines para usar as versões 1.9.1, 1.8.5 ou 1.8.4 do plug-in de origem de lote do Oracle.

Após o upgrade, o tipo de dados NUMBER do Oracle definido sem precisão e escala é mapeado para o tipo de dados string do CDAP no momento da execução. Se você tiver um estágio ou coletor downstream que consuma o tipo de dados decimal original do CDAP (para o qual o tipo de dados NUMBER do Oracle foi definido sem precisão e escala foi mapeado), atualize-o ou espere que ele consuma dados de string.

Se você entender o risco de possível perda de dados devido a erros de arredondamento, mas escolher usar o tipo de dados NUMBER do Oracle definido sem precisão e escala como tipo de dados decimal(38,0) do CDAP, implante o plug-in do Oracle versão 1.8.6 (para o Cloud Data Fusion 6.7.3) ou 1.9.2 (para o Cloud Data Fusion 6.8.1) no Hub e atualize os pipelines para usá-los.

Para mais informações, consulte a referência da fonte de lote do Oracle.

Excluir um cluster temporário do Dataproc

Quando o Cloud Data Fusion cria um cluster temporário do Dataproc durante o provisionamento da execução do pipeline, o cluster é excluído após a conclusão da execução do pipeline. Em casos raros, a exclusão do cluster falha.

Recomendado: faça upgrade para a versão mais recente do Cloud Data Fusion para garantir a manutenção adequada do cluster.

Definir o tempo máximo de inatividade

Para resolver esse problema, configure a opção Max Idle Time. Isso permite que o Dataproc exclua clusters automaticamente, mesmo que uma chamada explícita no final do pipeline falhe.

O Max Idle Time está disponível nas versões 6.4 e mais recentes do Cloud Data Fusion.

Recomendado: para versões anteriores à 6.6, defina Max Idle Time manualmente como 30 minutos ou mais.

Excluir clusters manualmente

Se não for possível fazer upgrade da versão ou configurar a opção Max Idle Time, exclua manualmente os clusters desatualizados:

Encontre o ID de cada projeto em que os clusters foram criados:
1. Nos argumentos de execução do pipeline, verifique se o ID do projeto do Dataproc foi personalizado para a execução.
2. Se um ID de projeto do Dataproc não for especificado explicitamente, determine qual provisionador é usado e verifique se há um ID de projeto:
  1. Nos argumentos de ambiente de execução do pipeline, verifique o valor system.profile.name.
  2. Abra as configurações do provisionador e verifique se o ID do projeto do Dataproc está definido. Se a configuração não estiver presente ou o campo estiver vazio, o projeto em que a instância do Cloud Data Fusion está sendo executada será usado.
Importante: várias execuções de pipeline podem usar projetos diferentes. Confira todos os IDs de projeto.
Para cada projeto:
1. Abra o projeto no console do Google Cloud e acesse a página Clusters do Dataproc.
  
  Acessar Clusters
2. Ordene os clusters pela data de criação, do mais antigo para o mais recente.
3. Se o painel de informações estiver oculto, clique em Mostrar painel de informações e acesse a guia Rótulos.
4. Para cada cluster que não está em uso, por exemplo, se mais de um dia se passou, verifique se ele tem um rótulo de versão do Cloud Data Fusion. Isso indica que ela foi criada pelo Cloud Data Fusion.
5. Marque a caixa de seleção ao lado do nome do cluster e clique em Excluir.

Não é possível criar uma instância do Cloud Data Fusion

Ao criar uma instância do Cloud Data Fusion, você pode encontrar o seguinte problema:

Read access to project PROJECT_NAME was denied.

Recomendação

Para resolver esse problema, desative e reative a API Cloud Data Fusion. Em seguida, crie a instância.

Os pipelines falham quando são executados em clusters do Dataproc com workers principais ou secundários

Nas versões 6.8 e 6.9 do Cloud Data Fusion, ocorre um problema que faz com que os pipelines falhem se forem executados em clusters do Dataproc:

ERROR [provisioning-task-2:i.c.c.i.p.t.ProvisioningTask@161] - PROVISION task failed in REQUESTING_CREATE state for program run program_run:default.APP_NAME.UUID.workflow.DataPipelineWorkflow.RUN_ID due to
Caused by: io.grpc.StatusRuntimeException: CANCELLED: Failed to read message.
Caused by: com.google.protobuf.GeneratedMessageV3$Builder.parseUnknownField(Lcom/google/protobuf/CodedInputStream;Lcom/google/protobuf/ExtensionRegistryLite;I)Z.

Recomendação

Para resolver o problema, faça upgrade para a revisão do patch 6.8.3.1, 6.9.2.1 ou mais recente.

Resolver problemas do Cloud Data Fusion

Resolver problemas de pipelines em lote

Erro de pipeline: arquivo de texto ocupado

Recomendação

O pipeline simultâneo está parado

Recomendação

A conexão SSH atinge o tempo limite enquanto um pipeline está em execução

Recomendação

Código de resposta: 401. Erro: erro desconhecido

Recomendação

Falha no pipeline com o plug-in do BigQuery com erro Access Denied

Recomendação

O pipeline não para no limite de erros

Recomendação

O plug-in de origem de lote do Oracle converte NUMBER em string

Recomendação

Excluir um cluster temporário do Dataproc

Definir o tempo máximo de inatividade

Excluir clusters manualmente

Não é possível criar uma instância do Cloud Data Fusion

Recomendação

Os pipelines falham quando são executados em clusters do Dataproc com workers principais ou secundários

Recomendação

Falha no pipeline com o plug-in do BigQuery com erro `Access Denied`

O plug-in de origem de lote do Oracle converte `NUMBER` em `string`