Guía de inicio rápido

En esta página, se muestra cómo ejecutar una canalización de genómica que utiliza la API de Cloud Life Sciences para crear un archivo de índice (archivo BAI) a partir de un gran archivo binario que contiene secuencias de ADN (archivo BAM).

Antes de comenzar

  1. Accede a tu Cuenta de Google.

    Si todavía no tienes una cuenta, regístrate para obtener una nueva.

  2. En GCP Console, ve a la página Administrar recursos y selecciona o crea un proyecto.

    Ir a la página Administrar recursos

  3. Comprueba que la facturación esté habilitada en tu proyecto.

    Descubre cómo puedes habilitar la facturación

  4. Habilita las Cloud Life Sciences, Compute Engine, and Cloud Storage JSON API necesarias.

    Habilita las API

  5. Realiza la instalación y la inicialización del SDK de Cloud.
  6. También puedes usar Cloud Shell, que ya tiene instalado el SDK de Cloud.

Ejecuta la canalización

Puedes ejecutar la canalización mediante curl o Windows PowerShell.

Comando curl

  1. Crea una variable de entorno BUCKET. La variable apunta a un depósito de Cloud Storage que utiliza el nombre de tu proyecto seguido de -life-sciences.

    export BUCKET=gs://PROJECT_ID-life-sciences
    
  2. Crea el depósito mediante el comando gsutil mb:

    gsutil mb ${BUCKET}
    
  3. Ejecuta una canalización con la herramienta de línea de comandos de gcloud. Para ello, especifica un nombre de archivo BAM para la entrada y un nombre de archivo BAI para la salida. La canalización invoca la API de Cloud Life Sciences, crea una instancia de VM de Compute Engine y, luego, ejecuta el proceso de canalización en la instancia. Una vez que ha finalizado el proceso, la instancia se cierra automáticamente y el archivo BAI se copia en tu depósito de Cloud Storage.

    gcloud beta lifesciences pipelines run \
        --regions us-east1 \
        --command-line 'samtools index ${BAM} ${BAI}' \
        --docker-image "gcr.io/genomics-tools/samtools" \
        --inputs BAM=gs://genomics-public-data/NA12878.chr20.sample.bam \
        --outputs BAI=${BUCKET}/NA12878.chr20.sample.bam.bai
    

    Si se completa correctamente, el comando muestra lo siguiente:

    Running [projects/PROJECT_ID/operations/OPERATION_ID]
    
  4. La canalización tarda unos minutos en finalizar. Puedes ejecutar el siguiente comando para hacer un seguimiento de su estado. Reemplaza OPERATION_ID con el valor impreso en el paso anterior.

    gcloud beta lifesciences operations wait OPERATION_ID 
    

    Después de que la operación finaliza, muestra el mensaje siguiente:

    Waiting for [projects/PROJECT_ID/operations/OPERATION_ID]...done.
    
  5. Verifica que se haya generado el archivo BAI:

    gsutil ls ${BUCKET}
    

    El comando debería mostrar lo siguiente:

    gs://BUCKET/NA12878.chr20.sample.bam.bai
    

Acabas de ejecutar una canalización mediante la API de Cloud Life Sciences para crear un archivo BAI a partir de un archivo BAM.

PowerShell

  1. Crea una variable de entorno BUCKET. La variable apunta a un depósito de Cloud Storage que utiliza el nombre de tu proyecto seguido de -life-sciences.

    $BUCKET = "gs://PROJECT_ID-life-sciences"
    
  2. Crea el depósito mediante el comando gsutil mb:

    gsutil mb ${BUCKET}
    
  3. Ejecuta una canalización con la herramienta de línea de comandos de gcloud. Para ello, especifica un nombre de archivo BAM para la entrada y un nombre de archivo BAI para la salida. La canalización invoca la API de Cloud Life Sciences, crea una instancia de VM de Compute Engine y, luego, ejecuta el proceso de canalización en la instancia. Una vez que ha finalizado el proceso, la instancia se cierra automáticamente y el archivo BAI se copia en tu depósito de Cloud Storage.

    gcloud beta lifesciences pipelines run `
        --regions us-east1 `
        --command-line 'samtools index ${BAM} ${BAI}' `
        --docker-image "gcr.io/genomics-tools/samtools" `
        --inputs BAM=gs://genomics-public-data/NA12878.chr20.sample.bam `
        --outputs BAI=${BUCKET}/NA12878.chr20.sample.bam.bai
    

    Si se completa correctamente, el comando muestra lo siguiente:

    Running [projects/PROJECT_ID/operations/OPERATION_ID]
    
  4. La canalización tarda unos minutos en finalizar. Puedes ejecutar el siguiente comando para hacer un seguimiento de su estado. Reemplaza OPERATION_ID con el valor impreso en el paso anterior.

    gcloud beta lifesciences operations wait OPERATION_ID 
    

    Después de que la operación finaliza, muestra el mensaje siguiente:

    Waiting for [projects/PROJECT_ID/operations/OPERATION_ID]...done.
    
  5. Verifica que se haya generado el archivo BAI:

    gsutil ls ${BUCKET}
    

    El comando debería mostrar lo siguiente:

    gs://BUCKET/NA12878.chr20.sample.bam.bai
    

Acabas de ejecutar una canalización mediante la API de Cloud Life Sciences para crear un archivo BAI a partir de un archivo BAM.

Limpia

Para evitar que se apliquen cargos a tu cuenta de GCP por los recursos que usaste en este instructivo, limpia los recursos que creaste en GCP. Las siguientes secciones describen cómo borrar o desactivar estos recursos.

Borra el proyecto

Si creaste el proyecto específicamente para esta guía de inicio rápido y ya no lo necesitas, puedes borrarlo. Cuando borras el proyecto, también se borra el depósito de Cloud Storage y el archivo BAI.

  1. En la GCP Console, dirígete a la página Proyectos.

    Ir a la página Proyectos

  2. En la lista de proyectos, selecciona el proyecto que deseas borrar y haz clic en Borrar.
  3. En el cuadro de diálogo, escribe el ID del proyecto y, luego, haz clic en Cerrar para borrar el proyecto.

Borra el archivo BAI

Para borrar el archivo BAI generado, pero conservar el proyecto y el depósito que creaste, ejecuta el comando gsutil rm:

gsutil rm ${BUCKET}/NA12878.chr20.sample.bam.bai

Borra el depósito

Si creaste el depósito específicamente para esta guía de inicio rápido y ya no lo necesitas, pero quieres conservar tu proyecto, borra el depósito con el comando gsutil rb. Cuando se borra el depósito también se borra el archivo BAI generado.

gsutil rb ${BUCKET}

Pasos siguientes

¿Te ha resultado útil esta página? Enviar comentarios:

Enviar comentarios sobre...

Cloud Life Sciences