Migrar a Batch desde Cloud Life Sciences

En esta página se describe cómo migrar a Batch desde Cloud Life Sciences.

Google Cloud anunció que Cloud Life Sciences se retiró el 17 de julio del 2023 y se cerró el 8 de julio del 2025. Sin embargo, Batch está disponible de forma general y es un sucesor completo que admite todos los casos prácticos de Cloud Life Sciences.

Consulta más información sobre Batch, Cloud Life Sciences y las fases de lanzamiento de productos.

Cloud Life Sciences y Batch

La migración de Cloud Life Sciences a Batch implica principalmente entender cómo puedes usar Batch para las cargas de trabajo que ejecutas actualmente mediante la ejecución de flujos de trabajo de Cloud Life Sciences.

Para saber cómo puedes ejecutar tus cargas de trabajo de Cloud Life Sciences en Batch, consulta todas las secciones siguientes:

Información general

Una pipeline de Cloud Life Sciences describe una secuencia de acciones (contenedores) que se van a ejecutar y el entorno en el que se van a ejecutar los contenedores.

Un trabajo por lotes describe una matriz de una o varias tareas y el entorno en el que se ejecutan esas tareas. La carga de trabajo de una tarea se define como una secuencia de uno o varios ejecutables (contenedores o secuencias de comandos) que se van a ejecutar. Cada tarea de un trabajo representa una ejecución de su secuencia de elementos ejecutables.

Las canalizaciones de Cloud Life Sciences se pueden expresar como tareas de Batch de una sola tarea.

Por ejemplo, en las siguientes muestras se describe una canalización de Cloud Life Sciences sencilla y su trabajo de Batch equivalente:

Pipeline de Cloud Life Sciences Tarea por lotes
  {
    "actions": [
      {
        "imageUri": "bash",
        "commands": [
          "-c",
          "echo Hello, world!"
        ]
      }
    ]
  }
  
    {
      "taskGroups" : [{
        "taskSpec" : {
          "runnables" : [{
            "container":{
              "imageUri": "bash",
              "commands": [
                "-c",
                "echo Hello, world!"
              ]
            }
          }]
        }
      }]
    }
    

Las tareas de Batch con varias tareas son similares a las copias de las pipelines de Cloud Life Sciences.

A diferencia de Cloud Life Sciences, Batch te permite programar automáticamente varias ejecuciones de tu carga de trabajo. Para indicar el número de veces que quieres ejecutar la secuencia de elementos Runnable de una tarea, define el número de tareas. Cuando una tarea tiene varias subtareas, puedes especificar cómo quieres que varíe cada ejecución haciendo referencia al índice de la subtarea en tus elementos ejecutables. Además, puedes configurar las programaciones relativas de las tareas de un trabajo. Por ejemplo, puedes indicar si quieres permitir que se ejecuten varias tareas en paralelo o si quieres que se ejecuten en orden secuencial y de una en una. Batch gestiona la programación de las tareas del trabajo: cuando finaliza una tarea, el trabajo inicia automáticamente la siguiente, si la hay.

Por ejemplo, consulta el siguiente trabajo por lotes. Este ejemplo de trabajo tiene 100 tareas que se ejecutan en 10 instancias de máquina virtual (VM) de Compute Engine, por lo que hay aproximadamente 10 tareas ejecutándose en paralelo en cualquier momento. Cada tarea de este ejemplo de trabajo solo ejecuta un elemento ejecutable: una secuencia de comandos que imprime un mensaje y el índice de la tarea, que se define mediante la variable de entorno predefinida BATCH_TASK_INDEX.

{
  "taskGroups" : [{
    "taskSpec" : {
      "runnables" : [{
        "script":{
          "text": "echo Hello world! This is task ${BATCH_TASK_INDEX}."
        }
      }]
    },
    "taskCount": 100,
    "parallelism": 10
  }]
}

Los flujos de trabajo que implican la creación y la monitorización de varias canalizaciones de Cloud Life Sciences similares se pueden simplificar aprovechando la programación integrada de Batch.

Operaciones básicas

En esta sección se describen las operaciones básicas de Cloud Life Sciences en comparación con Batch.

En la siguiente tabla se resumen las opciones de operaciones básicas de Cloud Life Sciences y Batch.

Funcionamiento básico Opciones de Cloud Life Sciences Opciones de lote
Ejecuta una carga de trabajo.
  • Ejecuta un flujo de procesamiento.
  • Crea y ejecuta un trabajo.
Ver todas tus cargas de trabajo.
  • Lista las operaciones de larga duración.
  • Consulta una lista de tus trabajos.
Consulta los detalles y el estado de una carga de trabajo.
  • Obtiene los detalles de una operación de larga duración.
  • Sondea una operación de larga duración.
  • Ver los detalles de un trabajo.
  • Ver la lista de tareas de un trabajo.
  • Ver los detalles de una tarea.
Detener y quitar una carga de trabajo.
  • Cancela una operación de larga duración.
  • Eliminar (y cancelar) una tarea.
  • Consulta el estado de una solicitud de eliminación de un trabajo.

Las operaciones básicas de Cloud Life Sciences y Batch tienen algunas diferencias clave.

En primer lugar, los recursos de operaciones de larga duración no desempeñan el mismo papel en Batch que en Cloud Life Sciences. Los recursos de operaciones de larga duración (LROs) de Cloud Life Sciences son el recurso principal que se usa para enumerar y ver tus pipelines. Sin embargo, los recursos de operaciones de larga duración de Batch y otras Google Cloud APIs solo se usan para monitorizar el estado de una solicitud que tarda mucho en completarse. En concreto, en Batch, la única solicitud que devuelve un recurso de operación de larga duración es la de eliminar un trabajo. Para obtener más información sobre los recursos de operaciones de larga duración de Batch, consulta la documentación de referencia de la API Batch sobre el recurso REST projects.locations.operations. En lugar de usar recursos de operaciones de larga duración, Batch tiene recursos de trabajos que puedes ver y eliminar para tus cargas de trabajo.

En segundo lugar, ver los detalles de una carga de trabajo en Batch implica operaciones diferentes a las de Cloud Life Sciences. Puedes ver un trabajo para consultar sus detalles y su estado. Sin embargo, cada tarea de un trabajo también tiene sus propios detalles y estado, que puedes consultar viendo la lista de tareas de un trabajo y los detalles de una tarea.

Para ayudarte a entender mejor las operaciones básicas de Cloud Life Sciences y Batch, en las siguientes secciones se proporcionan ejemplos de comandos de la CLI de Google Cloud y de rutas de solicitudes de API para algunas de estas operaciones básicas.

Ejemplos de comandos de la CLI de gcloud

En la CLI de gcloud, los comandos de Cloud Life Sciences empiezan por gcloud beta lifesciences y los comandos de Batch empiezan por gcloud batch. Por ejemplo, consulta los siguientes comandos de gcloud CLI.

  • Ejemplos de comandos de la CLI gcloud de Cloud Life Sciences:

    • Ejecuta un flujo de procesamiento:

      gcloud beta lifesciences pipelines run \
        --project=PROJECT_ID \
        --regions=LOCATION \
        --pipeline-file=JSON_CONFIGURATION_FILE
      
    • Para obtener los detalles de una operación de larga duración, sigue estos pasos:

      gcloud beta lifesciences operations describe OPERATION_ID
      

    Haz los cambios siguientes:

    • PROJECT_ID: el ID de proyecto de tu proyecto.
    • LOCATION: la ubicación de la pipeline.
    • JSON_CONFIGURATION_FILE: el archivo de configuración JSON de la canalización.
    • OPERATION_ID: identificador de la operación de larga duración que ha devuelto la solicitud para ejecutar la canalización.
  • Ejemplo de comandos de la CLI de gcloud por lotes:

    • Crea y ejecuta una tarea:

      gcloud batch jobs submit JOB_NAME \
        --project=PROJECT_ID \
        --location=LOCATION \
        --config=JSON_CONFIGURATION_FILE
      
    • Ver los detalles de un trabajo:

      gcloud batch jobs describe JOB_NAME \
        --project=PROJECT_ID \
        --location=LOCATION \
      
    • Para ver la lista de tareas de un trabajo, sigue estos pasos:

      ​​gcloud batch tasks list \
        --project=PROJECT_ID \
        --location=LOCATION \
        --job=JOB_NAME
      
    • Ver los detalles de una tarea:

      gcloud batch tasks describe TASK_INDEX \
        --project=PROJECT_ID \
        --location=LOCATION \
        --job=JOB_NAME \
        --task_group=TASK_GROUP
      
    • Eliminar (y cancelar) una tarea:

      gcloud batch jobs delete JOB_NAME \
        --project=PROJECT_ID \
        --location=LOCATION
      

    Haz los cambios siguientes:

    • JOB_NAME: el nombre del puesto.
    • PROJECT_ID: el ID de proyecto de tu proyecto.
    • LOCATION: la ubicación del puesto.
    • JSON_CONFIGURATION_FILE: la ruta de un archivo JSON con los detalles de configuración del trabajo.
    • TASK_INDEX: el índice de la tarea de la que quieres ver los detalles. En un grupo de tareas, el índice de tareas empieza por 0 en la primera tarea y aumenta en 1 con cada tarea adicional. Por ejemplo, un grupo de tareas que contiene cuatro tareas tiene los índices 0, 1, 2 y 3.
    • TASK_GROUP_NAME: el nombre del grupo de tareas del que quieres ver los detalles. El valor debe ser group0.

Rutas de solicitud de API de ejemplo

En el caso de las APIs, Cloud Life Sciences usa rutas de solicitud lifesciences.googleapis.com y Batch usa rutas de solicitud batch.googleapis.com. Por ejemplo, consulta las siguientes rutas de solicitudes de API. A diferencia de Cloud Life Sciences, Batch no tiene una API RPC, sino solo una API REST.

  • Rutas de solicitudes de API de ejemplo de Cloud Life Sciences:

    • Ejecuta un flujo de procesamiento:

      POST https://lifesciences.googleapis.com/v2beta/projects/PROJECT_ID/locations/LOCATION/pipelines:run
      
    • Para obtener los detalles de una operación de larga duración, sigue estos pasos:

      GET https://lifesciences.googleapis.com/v2beta/projects/PROJECT_ID/locations/LOCATION/operations/OPERATION_ID
      

    Haz los cambios siguientes:

    • PROJECT_ID: el ID de proyecto de tu proyecto.
    • LOCATION: la ubicación de la pipeline.
    • OPERATION_ID: identificador de la operación de larga duración que ha devuelto la solicitud para ejecutar la canalización.
  • Rutas de solicitudes de ejemplo a la API por lotes:

    • Crea y ejecuta una tarea:

      POST https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs?job_id=JOB_NAME
      
    • Ver los detalles de un trabajo:

      GET https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs/JOB_NAME
      
    • Para ver la lista de tareas de un trabajo, sigue estos pasos:

      GET https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs/JOB_NAME/taskGroups/TASK_GROUP/tasks
      
    • Eliminar una tarea

      DELETE https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/jobs/JOB_NAME
      
    • Para comprobar el estado de una solicitud de eliminación de un trabajo, sigue estos pasos:

      GET https://batch.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/operations/OPERATION_ID
      

    Haz los cambios siguientes:

    • PROJECT_ID: el ID de proyecto de tu proyecto.
    • LOCATION: la ubicación del puesto.
    • JOB_NAME: el nombre del puesto.
    • TASK_GROUP_NAME: el nombre del grupo de tareas del que quieres ver los detalles. El valor debe ser group0.
    • OPERATION_ID: identificador de la operación de larga duración, que ha devuelto la solicitud para eliminar el trabajo.

Funciones y permisos de IAM

En esta sección se resumen las diferencias entre los roles y permisos de Gestión de Identidades y Accesos de Cloud Life Sciences y Batch. Para obtener más información sobre los roles y sus permisos, consulta la referencia de roles básicos y predefinidos de gestión de identidades y accesos.

En la siguiente tabla se describen los roles predefinidos y los permisos que necesitan los usuarios de Cloud Life Sciences.

Roles de Cloud Life Sciences Permisos

Cualquiera de las siguientes:

  • Administrador de Cloud Life Sciences (roles/lifesciences.admin) en el proyecto
  • Editor de Cloud Life Sciences (roles/lifesciences.editor) en el proyecto
  • Ejecutor de flujos de trabajo de Cloud Life Sciences (roles/lifesciences.workflowsRunner) en el proyecto
  • lifesciences.workflows.run
  • lifesciences.operations.cancel
  • lifesciences.operations.get
  • lifesciences.operations.list
Lector de Cloud Life Sciences (roles/lifesciences.viewer) en el proyecto
  • lifesciences.operations.get
  • lifesciences.operations.list
  • resourcemanager.projects.get
  • resourcemanager.projects.list

En la siguiente tabla se describen algunos de los roles predefinidos y sus permisos para Batch. A diferencia de Cloud Life Sciences, Batch requiere que concedas permisos a los usuarios y a la cuenta de servicio de un trabajo. Para obtener más información sobre los requisitos de gestión de identidades y accesos, consulta los requisitos previos de Batch.

Roles por lotes para usuarios Permisos
Editor de trabajos por lotes (roles/batch.jobsEditor) en el proyecto
  • batch.jobs.create
  • batch.jobs.delete
  • batch.jobs.get
  • batch.jobs.list
  • batch.locations.get
  • batch.locations.list
  • batch.operations.get
  • batch.operations.list
  • batch.tasks.get
  • batch.tasks.list
  • resourcemanager.projects.get
  • resourcemanager.projects.list
Lector de tareas de parche (roles/batch.jobsViewer) en el proyecto
  • batch.jobs.get
  • batch.jobs.list
  • batch.locations.get
  • batch.locations.list
  • batch.operations.get
  • batch.operations.list
  • batch.tasks.get
  • batch.tasks.list
  • resourcemanager.projects.get
  • resourcemanager.projects.list
Usuario de cuenta de servicio (roles/iam.serviceAccountUser) en la cuenta de servicio del trabajo
  • iam.serviceAccounts.actAs
  • iam.serviceAccounts.get
  • iam.serviceAccounts.list
  • resourcemanager.projects.get
  • resourcemanager.projects.list
Roles por lotes para cuentas de servicio Permisos
Reporter de agente de Batch (roles/batch.agentReporter) en el proyecto
  • batch.states.report

Funciones correspondientes

En la siguiente tabla se describen las funciones de Cloud Life Sciences, las funciones equivalentes de Batch y los detalles sobre las diferencias entre ellas.

Cada función se representa mediante una descripción y su sintaxis JSON. Puedes usar la sintaxis JSON cuando accedas a Batch a través de la API o cuando especifiques un archivo de configuración JSON mediante la CLI de Google Cloud. Sin embargo, ten en cuenta que también puedes usar las funciones de lote con otros métodos, como los campos de la consola Google Cloud , las marcas de la CLI de gcloud y las bibliotecas de cliente, que se describen en la documentación de Batch.

Para obtener más información sobre cada función y su sintaxis JSON, consulte lo siguiente:

Funciones de Cloud Life Sciences Funciones de lote Detalles
pipeline (pipeline) tarea (job) y sus subtareas (taskGroups[])

Un trabajo por lotes consta de una matriz de una o varias tareas que ejecutan los mismos elementos ejecutables. Una canalización de Cloud Life Sciences es similar a un trabajo de Batch con una tarea. Sin embargo, Cloud Life Sciences no tiene un concepto equivalente para las tareas (de los trabajos con varias tareas), que son algo parecido a las repeticiones de un flujo de trabajo.

Para obtener más información sobre los trabajos y las tareas, consulta la información general de Batch.

acciones (actions[]) de una canalización ejecutables (runnables[]) de las tareas de un trabajo

Una acción de Cloud Life Sciences describe un contenedor, pero un elemento ejecutable de Batch puede contener un contenedor o una secuencia de comandos.

Credenciales (credentials) de una acción

En el caso de un contenedor ejecutable:

En Cloud Life Sciences, las credenciales de una acción deben ser un diccionario cifrado de Cloud Key Management Service con pares clave-valor de nombre de usuario y contraseña.

En Batch, el nombre de usuario y la contraseña de un contenedor ejecutable se encuentran en campos independientes. Cualquiera de los campos se puede especificar con texto sin formato o con el nombre de un secreto de Secret Manager.

para una acción:

En un entorno:

Entornos posibles:

Cloud Life Sciences le permite especificar las variables de entorno de una acción que tengan el formato de texto sin formato o de diccionario cifrado. En Batch, es similar a tener el entorno de un elemento ejecutable (campo environment en runnables[]) que incluya variables con formato de texto sin formato (variables) o de diccionario cifrado (encryptedVariables).

Sin embargo, Batch también tiene más opciones para especificar variables de entorno:

  • En lugar de especificar variables como texto sin formato o un diccionario cifrado, puede especificar variables mediante secretos de Secret Manager usando una variable de secreto (secretVariables).
  • Como alternativa a especificar una variable de entorno para un ejecutable, puedes especificar una variable de entorno para todos los ejecutables mediante el campo environment de taskSpec.
  • Como alternativa a especificar una variable de entorno que tenga el mismo valor para cada tarea, puedes especificar una variable de entorno que tenga un valor diferente para cada tarea mediante el campo taskEnvironments[] de taskGroups[].

Para obtener más información, consulta Usar variables de entorno.

Etiquetas de una solicitud para ejecutar una canalización (labels en el cuerpo de la solicitud) etiquetas de un trabajo (labels en el recurso de trabajo)

A diferencia de Cloud Life Sciences, Batch no incluye un campo de etiquetas en la solicitud para crear un nuevo trabajo. La opción más parecida a Batch es usar etiquetas que solo estén asociadas al trabajo.

Batch tiene varios tipos de etiquetas (campos labels) que puedes usar al crear un trabajo. Para obtener más información, consulta Organizar recursos con etiquetas.

regiones (regions[]) y zonas (zones[]) de los recursos de una canalización (resources) Ubicaciones permitidas (allowedLocations) de la política de ubicación de recursos de un trabajo (locationPolicy)

En Cloud Life Sciences, una canalización se ejecuta en una sola VM, para la que puedes especificar las regiones o zonas que quieras.

En Batch, la opción equivalente son las ubicaciones permitidas de un trabajo, que puedes definir como una o varias regiones o zonas, y especifica dónde se pueden crear las VMs de un trabajo. Todas las VMs de un mismo trabajo de Batch pertenecen a un único grupo de instancias gestionado (MIG), que se encuentra en una región concreta. Sin embargo, las VMs individuales pueden estar en zonas diferentes de esa región.

Es importante destacar que especificar el campo de ubicaciones permitidas de un empleo es opcional, ya que es independiente de la ubicación del empleo. A diferencia de la ubicación de la tarea, la ubicación permitida no afecta a la ubicación que se usa para crear una tarea por lotes y almacenar los metadatos de la tarea. Para obtener más información, consulta Ubicaciones de lotes.

para los recursos de una canalización (resources):

para la política de recursos de un trabajo (allocationPolicy):

En Cloud Life Sciences, puedes configurar la máquina virtual en la que se ejecuta una canalización.

En Batch, las mismas opciones de las VMs están disponibles en los campos de la política de asignación de recursos de un trabajo (allocationPolicy):

  • La cuenta de servicio, las etiquetas y la configuración de red de las VMs se definen en sus campos correspondientes.
  • El campo de la VM (instances), que puedes definir directamente o mediante una plantilla de instancia, incluye las opciones de configuración del tipo de máquina, la plataforma de CPU mínima permitida, el disco de arranque y cualquier otro disco conectado, así como las GPUs y los controladores de GPU.

para una acción:

para un elemento ejecutable:

Estas diversas marcas de conveniencia de Cloud Life Sciences son equivalentes en Batch , excepto que se especifican para cada ejecutable (que puede contener una secuencia de comandos o un contenedor) en lugar de para cada acción (contenedor).

para una acción:

  • Opción para publicar puertos expuestos (publishExposedPorts)
  • Opción para especificar el espacio de nombres del ID de proceso (PID) (pidNamespace)
  • y la opción para especificar las asignaciones de puertos de contenedor a host (portMappings)
opciones (options) de un contenedor ejecutable

Estas opciones de Cloud Life Sciences (y otras) se admiten en Batch a través del campo options (options) de un elemento ejecutable de contenedor. Define el campo de opciones con las marcas que quieras que Batch añada al comando docker run (por ejemplo, -P --pid mynamespace -p 22:22).

para una acción:

no hay equivalente

Prefetch por lotes las imágenes y procesa las salidas de todos los elementos ejecutables de forma idéntica de acuerdo con la política de registros de la tarea (logsPolicy).

Opción para bloquear redes externas (blockExternalNetwork) en una acción Opción para bloquear redes externas (blockExternalNetwork) en un elemento ejecutable de contenedor

La opción de Cloud Life Sciences para bloquear redes externas en una acción es similar a la opción de lote para bloquear redes externas en un contenedor.

Batch también tiene muchas otras opciones de redes, como bloquear las redes externas de todas las VMs de una tarea. Para obtener más información, consulta el resumen de la creación de redes por lotes.

montajes (mounts[]) para una acción volúmenes de todos los elementos ejecutables (volumes[] en taskSpec) y opciones de volumen de un contenedor (volumes[] en container)

En Batch, puedes usar el campo volumes[] de taskSpec para definir los volúmenes de una tarea y sus rutas de montaje. Batch monta volúmenes de almacenamiento en las VMs de la tarea y todos los elementos ejecutables de la tarea (scripts o contenedores) pueden acceder a los volúmenes de almacenamiento. Este montaje se realiza antes de que la VM ejecute cualquier tarea o elemento ejecutable.

Además, Batch admite opciones de volumen explícitas en los elementos ejecutables de los contenedores mediante el campo volumes[] en container. Estas opciones de montaje se transfieren al contenedor como opciones de la marca --volume del comando docker run. Por ejemplo, el valor [ "/etc:/etc", "/foo:/bar" ] se traduce al comando docker run --volume /etc:/etc --volume /foo:/bar en el contenedor.

Para obtener más información sobre cómo usar volúmenes de almacenamiento con Batch, consulta Crear y ejecutar un trabajo que use volúmenes de almacenamiento.

Opción para habilitar Cloud Storage FUSE (enableFuse) en una acción no hay equivalente

Batch se encarga de montar los volúmenes de almacenamiento, como un segmento de Cloud Storage, que especifiques para una tarea. Por lo tanto, no habilitas ninguna herramienta de montaje como Cloud Storage FUSE para Batch. Sin embargo, puedes especificar opciones de montaje para tus volúmenes de almacenamiento mediante el campo mountOptions[].

Para obtener más información sobre cómo usar segmentos de Cloud Storage con Batch, consulta Crear y ejecutar un trabajo que use volúmenes de almacenamiento.

Tema de Pub/Sub (pubSubTopic) de una solicitud para ejecutar una canalización

para las configuraciones de notificaciones de un trabajo (notifications[]):

Batch permite personalizar las actualizaciones de estado más que Cloud Life Sciences. Por ejemplo, se puede notificar a los usuarios de Batch en un tema de Pub/Sub cuando cambie el estado de tareas concretas o solo cuando cambie el estado general del trabajo.

Servicios de flujo de trabajo

Si usas un servicio de flujo de trabajo con Cloud Life Sciences, el proceso de migración también implica configurar un servicio de flujo de trabajo para que funcione con Batch. En esta sección se resumen los servicios de flujo de trabajo que puedes usar con Batch.

Batch admite Workflows, que es un servicio de flujo de trabajo de Google Cloud. Si quieres usar Workflows con Batch, consulta Ejecutar una tarea de Batch con Workflows. De lo contrario, en la siguiente tabla se describen otros servicios de flujo de trabajo que puedes usar con Cloud Life Sciences y con Batch. En esta tabla se indican las principales diferencias entre el uso de cada servicio de flujo de trabajo con Batch en lugar de con Cloud Life Sciences, así como detalles sobre dónde obtener más información sobre el uso de cada servicio con Batch.

Servicio de flujo de trabajo Diferencias principales Detalles
Cromwell

Para usar un archivo de configuración de Cromwell con la API Cloud Life Sciences v2beta en lugar de la API Batch, haz los siguientes cambios:

  1. En el campo actor-factory, sustituya cromwell.backend.google.pipelines.v2beta.PipelinesApiLifecycleActorFactory por cromwell.backend.google.batch.GcpBatchLifecycleActorFactory.
  2. Elimina el campo genomics.endpoint-url.
  3. Genera un archivo de configuración.
Para obtener más información sobre cómo usar Batch con Cromwell, consulta la documentación de Cromwell sobre Batch y el tutorial de Cromwell sobre Batch.
dsub

Para usar una canalización de dsub para Cloud Life Sciences con Batch, haz los siguientes cambios:

  • En el campo provider, sustituya google-cls-v2 por google-batch.
Para obtener más información sobre cómo usar Batch con dsub, consulta la documentación de dsub sobre Batch.
Siguiente flujo

Para usar un archivo de configuración de Nextflow para Cloud Life Sciences con Batch, haz los siguientes cambios:

  1. En el campo executor, sustituya google-lifesciences por google-batch.
  2. En todos los prefijos config, sustituye google.lifeScience por google.batch.
Para obtener más información sobre cómo usar Batch con Nextflow, consulta un tutorial de Batch o un tutorial de Nextflow. Para obtener más información sobre las opciones de configuración, consulta la documentación de Nextflow.
Snakemake

Para usar una canalización de Snakemake con la API Cloud Life Sciences v2 beta en lugar de la API Batch, haz los siguientes cambios:

  1. Asegúrate de que estás usando la versión 8 o una posterior de Snakemake. Para obtener más información, consulta Migración entre versiones de Snakemake.
  2. Haz los siguientes cambios en el comando snakemake:

    • Sustituye la marca --google-lifesciences por la marca --executor googlebatch.
    • Sustituye cualquier otra marca que tenga el prefijo --google-lifesciences- por el prefijo --googlebatch-.
Para obtener más información sobre cómo usar Batch con Snakemake, consulta la documentación de Snakemake para Batch.

Siguientes pasos

  • Para configurar Batch para nuevos usuarios y proyectos, consulta el artículo Empezar.
  • Para saber cómo ejecutar cargas de trabajo con Batch, consulta Crear un trabajo.