Detener una canalización en ejecución

Si necesitas detener un trabajo de Cloud Dataflow, puedes hacerlo mediante la emisión de un comando con la interfaz de supervisión de Cloud Dataflow o la interfaz de línea de comandos de Cloud Dataflow. Hay dos comandos posibles que puedes emitir para detener tu trabajo: Cancelar y Desviar.

Cómo detener un trabajo con la IU de supervisión de Cloud Dataflow

Para detener un trabajo, selecciónalo de la lista de trabajos en la interfaz de supervisión de Cloud Dataflow. En la tarjeta de información de tu trabajo, haz clic en Stop Job (Detener trabajo).

Figura 1: Tarjeta de información para un trabajo de Cloud Dataflow, con el botón Stop Job (Detener trabajo).

El cuadro de diálogo Stop Job (Detener trabajo) aparece con las opciones para detener el trabajo:

Figura 2: Cuadro de diálogo Stop Job (Detener trabajo) con opciones para cancelar (Cancel) y desviar (Drain).

Selecciona la opción Cancel (Cancelar) o Drain (Desviar) según corresponda y haz clic en el botón Stop Job (Detener trabajo).

Cancelar

Usar la opción Cancelar para detener el trabajo le indica al servicio de Cloud Dataflow que cancele el trabajo inmediatamente. El servicio detendrá todo el procesamiento y la transferencia de datos tan pronto como sea posible y comenzará inmediatamente a borrar los recursos de Google Cloud Platform (GCP) adjuntos al trabajo. Estos recursos pueden incluir el cierre de las instancias de trabajador de Compute Engine y el cierre de conexiones activas a fuentes o receptores de E/S.

Debido a que Cancelar detiene inmediatamente el procesamiento, puedes perder cualquier dato "en tránsito". Los datos "en tránsito" se refieren a los datos que se leyeron, pero que tu canalización aún está procesando. Los datos escritos desde tu canalización a un receptor de salida antes de emitir el comando Cancelar todavía pueden estar disponibles en tu receptor de salida.

Si la pérdida de datos no es un problema, usa la opción Cancelar para detener el trabajo y asegurarte de que los recursos de GCP asociados con tu trabajo se cierren lo antes posible.

Desviar

Cuando usas la opción Desviar para detener el trabajo, el servicio de Cloud Dataflow debe finalizar el trabajo en su estado actual. El trabajo inmediatamente dejará de transferir nuevos datos de las fuentes de entrada. Sin embargo, el servicio de Cloud Dataflow conservará los recursos existentes, como las instancias de trabajador, para finalizar el procesamiento y la escritura de los datos almacenados en búfer en tu canalización. Cuando se completen todas las operaciones de procesamiento y escritura pendientes, el servicio de Cloud Dataflow borrará los recursos de GCP asociados con el trabajo.

Usa la opción Desviar para detener tu trabajo si deseas evitar la pérdida de datos a medida que desconectas la canalización.

Los efectos de desviar un trabajo

Cuando emites el comando Desviar, Cloud Dataflow cierra inmediatamente cualquier ventana en proceso y enciende todos los activadores. El sistema no espera a que finalicen las ventanas pendientes basadas en el tiempo. Por ejemplo, si pasaron 10 minutos de una ventana de canalización de 2 horas cuando emites el comando Desviar, Cloud Dataflow no esperará a que finalice el resto de la ventana. La ventana se cerrará inmediatamente con resultados parciales.

En la vista detallada de las transformaciones de la canalización, puedes ver los efectos de un comando de desvío en proceso:

Figura 3: Vista de un paso con desvío en progreso; observa que la marca de agua avanzó al valor máximo.

¿Te sirvió esta página? Envíanos tu opinión:

Enviar comentarios sobre…

¿Necesitas ayuda? Visita nuestra página de asistencia.