Soluciona problemas de herramientas de redes de Dataflow

En esta página, se muestra cómo resolver problemas con las herramientas de redes de Dataflow.

La interfaz de red debe especificar una subred si el recurso de red está en modo de subred personalizado

El siguiente error ocurre cuando ejecutas un trabajo de Dataflow:

Workflow failed. Causes: Invalid Error: Message: Invalid value for field
'resource.properties.networkInterfaces[0].subnetwork': ''. Network interface
must specify a subnet if the network resource is in custom subnet mode. HTTP
Code: 400

Este problema se produce si la red de VPC llamada default se convirtió de una red de VPC de modo automático a una red de VPC de modo personalizado.

Para resolver este problema, especifica el parámetro de subred cuando uses una red de VPC de modo personalizado. Para obtener más información, consulta Especifica una red y una subred.

No se permiten referencias entre proyectos para este recurso

El siguiente error ocurre cuando ejecutas un trabajo de Dataflow en una red de VPC compartida:

Invalid value for field 'resource.properties.networkInterfaces[0].subnetwork':
'https://www.googleapis.com/compute/v1/projects/PROJECT/regions/REGION/subnetworks/SUBNETWORK'.
Cross-project references for this resource are not allowed.

Este problema ocurre si especificas una subred en una red de VPC compartida, pero el proyecto de servicio no está conectado al proyecto host de VPC compartida.

Para resolver este problema, un administrador de VPC compartida debe vincular el proyecto de servicio al proyecto host.

La cuenta de servicio de Dataflow no puede acceder a la red o subred o no existe

Uno de los siguientes errores ocurre cuando intentas ejecutar un trabajo de Dataflow. En caso de que la tarea fracase.

Workflow failed. Causes: Network default is not accessible to Dataflow Service
account or does not exist
Workflow failed. Causes: Subnetwork SUBNETWORK is not
accessible to Dataflow Service account or does not exist

Esto puede suceder por los siguientes motivos:

  • Omites la subred y los parámetros de red cuando creas el trabajo de Dataflow, pero no existe una red de VPC de modo automático llamada default en tu proyecto. Es posible que no tengas una red predeterminada si esta se borró o si una restricción de la política de la organización te impide crear una red predeterminada.
  • Falta la subred.
  • El parámetro de subred se especificó de forma incorrecta.
  • Faltan los permisos necesarios para la cuenta de servicio de Dataflow.

Para resolver este problema, sigue los lineamientos para especificar una red y una subred.

Se agotó el tiempo de espera de RPC o no se pudo conectar en los puertos 12345 o 12346

Uno de los siguientes errores ocurre cuando ejecutas un trabajo de Dataflow que no usa Streaming Engine ni Dataflow Shuffle. El trabajo se atasca o falla.

Para los trabajos de transmisión, haz lo siguiente:

Rpc to WORKER_HARNESS:12345 completed with error
UNAVAILABLE: failed to connect to all addresses; last error : UNKNOWN:
ipv4:WORKER_IP_ADDRESS:12345: Failed to connect to remote
host: FD Shutdown

Para trabajos por lotes:

(g)RPC timed out when SOURCE_WORKER_HARNESS talking to
DESTINATION_WORKER_HARNESS:12346.

Este problema se produce si falta una regla de firewall que permite el tráfico de red en los puertos TCP 12345 y 12346. Cuando en el trabajo se usan varios trabajadores, estos no pueden comunicarse entre sí.

Para resolver este problema, consulta los pasos para solucionar problemas en DEADLINE_EXCEEDED o Server Unresponsive.

Un solo trabajador se inicia y se detiene varias veces

El siguiente problema ocurre cuando inicias un trabajo de Dataflow. En la página Métricas del trabajo del trabajo de Dataflow, el gráfico Uso de CPU (todos los trabajadores) muestra que un trabajador se inicia de manera repetida y, luego, se detiene después de hacerlo. unos minutos. Solo hay un trabajador disponible a la vez.

Gráfico de uso de CPU en el que se muestra que un trabajador a la vez se crea de forma repetida y, luego, se detiene.

Se produce el siguiente error:

The Dataflow job appears to be stuck because no worker activity has been seen
in the last 1h. Please check the worker logs in Stackdriver Logging.

No se crean registros de trabajadores.

En los registros del trabajo, pueden aparecer varios mensajes similares a los siguientes:

Autoscaling: Raised the number of workers to 1 based on the rate of progress in
the currently running stage(s).

Este problema se produce si la red de VPC no tiene una ruta predeterminada a Internet ni una ruta predeterminada a la subred.

Para resolver este problema, agrega rutas predeterminadas a tu red de VPC. Si deseas obtener más información, consulta Acceso a Internet para Dataflow.

La subred no tiene Acceso privado a Google

El siguiente error ocurre cuando inicias un trabajo de Dataflow en el que las direcciones IP externas están inhabilitadas:

Workflow failed. Causes: Subnetwork SUBNETWORK on project
PROJECT_ID network NETWORK in
region REGION does not have Private Google Access, which
is required for usage of private IP addresses by the Dataflow workers.

Este problema se produce si desactivas las direcciones IP externas sin habilitar el Acceso privado a Google.

Para resolver este problema, habilita el Acceso privado a Google para la subred que usa el trabajo de Dataflow.