Los componentes de Dataproc sin servidores te permiten ejecutar cargas de trabajo por lotes de Apache Spark desde una canalización dentro de Vertex AI Pipelines. Dataproc Serverless ejecuta las cargas de trabajo por lotes en una infraestructura de procesamiento administrada, con ajuste de escala automático de los recursos según sea necesario.
Obtén más información sobre Dataproc sin servidores y cargas de trabajo compatibles con Spark.
En Dataproc sin servidores, un recurso Batch
representa una carga de trabajo por lotes.
El SDK de componentes de canalización de Google Cloud incluye los siguientes operadores para crear recursos Batch
y supervisar su ejecución:
Referencia de la API
A fin de obtener la referencia del componente, consulta la referencia del SDK de componentes de canalización de Google Cloud para componentes sin servidores de Dataproc.
Para obtener la referencia de los recursos sin servidores de Dataproc, consulta la siguiente página de referencia de la API:
- Recurso
Batch
- Recurso
Instructivos
Historial de versiones y notas de la versión
Para obtener más información sobre el historial de versiones y los cambios en el SDK de componentes de canalización de Google Cloud, consulta las notas de la versión del SDK de componentes de canalización de Google Cloud.
Contactos de asistencia técnica
Si tienes alguna pregunta, comunícate con kfp-dataproc-components@google.com.