Componentes sin servidores de Dataproc

Los componentes de Dataproc sin servidores te permiten ejecutar cargas de trabajo por lotes de Apache Spark desde una canalización dentro de Vertex AI Pipelines. Dataproc Serverless ejecuta las cargas de trabajo por lotes en una infraestructura de procesamiento administrada, con ajuste de escala automático de los recursos según sea necesario.

Obtén más información sobre Dataproc sin servidores y cargas de trabajo compatibles con Spark.

En Dataproc sin servidores, un recurso Batch representa una carga de trabajo por lotes. El SDK de componentes de canalización de Google Cloud incluye los siguientes operadores para crear recursos Batch y supervisar su ejecución:

Referencia de API

Para ver la referencia del componente, consulta la página de referencia del SDK de google_cloud_pipeline_components.

Para obtener la referencia de los recursos sin servidores de Dataproc, consulta la siguiente página de referencia de la API:

  • Batch referencia del recurso

Instructivos

Historial de versiones y notas de la versión

Para obtener más información sobre el historial de versiones y los cambios en el SDK de componentes de canalización de Google Cloud, consulta las notas de la versión del SDK de componentes de canalización de Google Cloud.

Contactos de asistencia técnica

Si tienes alguna pregunta, comunícate con kfp-dataproc-components@google.com.