Detén una canalización en ejecución

Si necesitas detener un trabajo de Cloud Dataflow, puedes hacerlo mediante la emisión de un comando con la interfaz de supervisión de Cloud Dataflow o la interfaz de línea de comandos de Cloud Dataflow. Hay dos comandos posibles que puedes emitir para detener tu trabajo: Cancelar (Cancel) y Desviar (Drain).

Detén un trabajo con la IU de supervisión de Cloud Dataflow

Para detener un trabajo, selecciónalo de la lista de trabajos en la interfaz de supervisión de Cloud Dataflow. En la tarjeta de información de tu trabajo, haz clic en Detener trabajo (Stop Job).

Figura 1: Tarjeta de información para un trabajo de Cloud Dataflow, con el botón Detener trabajo (Stop Job).

El cuadro de diálogo Detener trabajo (Stop Job) aparece con las opciones para detener el trabajo:

Figura 2: Cuadro de diálogo Detener trabajo (Stop Job) con opciones para cancelar (Cancel) y desviar (Drain).

Selecciona la opción Cancelar (Cancel) o Desviar (Drain) según corresponda y haz clic en el botón Detener trabajo (Stop Job).

Cancelar

Usar la opción Cancelar para detener el trabajo le indica al servicio de Cloud Dataflow que cancele el trabajo inmediatamente. El servicio detendrá todo el procesamiento y la transferencia de datos tan pronto como sea posible y comenzará inmediatamente a borrar los recursos de Google Cloud Platform (GCP) adjuntos al trabajo. Estos recursos pueden incluir el cierre de las instancias de trabajador de Compute Engine y el cierre de conexiones activas a fuentes o receptores de E/S.

Debido a que Cancelar detiene inmediatamente el procesamiento, puedes perder cualquier dato "en tránsito". Los datos "en tránsito" se refieren a los datos que se leyeron, pero que tu canalización aún está procesando. Los datos escritos desde tu canalización a un receptor de salida antes de emitir el comando Cancelar todavía pueden estar disponibles en tu receptor de salida.

Si la pérdida de datos no es un problema, usa la opción Cancelar para detener el trabajo y asegurarte de que los recursos de GCP asociados con tu trabajo se cierren lo antes posible.

Desviar

Cuando usas la opción Desviar para detener el trabajo, el servicio de Cloud Dataflow debe finalizar el trabajo en su estado actual. El trabajo deja de transferir datos nuevos de las fuentes de entrada poco después de recibir la solicitud de desvío (por lo general, dentro de unos minutos). Sin embargo, el servicio de Cloud Dataflow conserva los recursos existentes, como las instancias de trabajador, para finalizar el procesamiento y la escritura de los datos almacenados en búfer en tu canalización. Cuando se completan todas las operaciones de procesamiento y escritura pendientes, el servicio de Cloud Dataflow borra los recursos de GCP asociados con el trabajo.

Si deseas evitar la pérdida de datos a medida que desactivas las canalizaciones, utiliza la opción Desviar para detener tu trabajo.

Los efectos de desviar un trabajo

Cuando emites el comando Desviar, Cloud Dataflow cierra inmediatamente cualquier ventana en proceso y enciende todos los activadores. El sistema no espera a que finalicen las ventanas pendientes basadas en el tiempo. Por ejemplo, si pasaron 10 minutos de una ventana de canalización de 2 horas cuando emites el comando Desviar, Cloud Dataflow no esperará a que finalice el resto de la ventana. La ventana se cierra inmediatamente con resultados parciales.

En la vista detallada de las transformaciones de la canalización, puedes ver los efectos de un comando de desvío en proceso:

Figura 3: Vista de un paso con desvío en progreso. Observa que la marca de agua avanzó al valor máximo.

¿Te sirvió esta página? Envíanos tu opinión:

Enviar comentarios sobre…

¿Necesitas ayuda? Visita nuestra página de asistencia.