Guía de inicio rápido

En esta página, se muestra cómo ejecutar una canalización que use la API de Cloud Genomics Pipelines para crear un archivo de índice (archivo BAI) a partir de un archivo binario de gran tamaño que contenga secuencias de ADN (archivo BAM).

Antes de comenzar

  1. Accede a tu Cuenta de Google.

    Si todavía no tienes una cuenta, regístrate para obtener una nueva.

  2. En GCP Console, ve a la página Administrar recursos y selecciona o crea un proyecto.

    Ir a la página Administrar recursos

  3. Comprueba que la facturación esté habilitada en tu proyecto.

    Descubre cómo puedes habilitar la facturación

  4. Habilita las Cloud Genomics, Compute Engine, and Cloud Storage JSON API necesarias.

    Habilita las API

  5. Realiza la instalación y la inicialización del SDK de Cloud.
  6. De manera opcional, también puedes usar Google Cloud Shell, que viene con el SDK de Cloud ya instalado.

Ejecuta la canalización

  1. Crea una variable de entorno BUCKET. La variable dirige a un depósito de Cloud Storage que utiliza el nombre de tu proyecto con -genomics anexado.

    export BUCKET=gs://PROJECT_ID-genomics
    
  2. Crea el depósito mediante el comando gsutil mb:

    gsutil mb ${BUCKET}
    
  3. Ejecuta una canalización mediante la herramienta de línea de comandos de gcloud, con un archivo BAM como entrada y un archivo BAI como salida. La canalización invoca a la API de Pipelines, crea una instancia de VM de Compute Engine y, luego, ejecuta el proceso de canalización en la instancia. Una vez que ha finalizado el proceso, la instancia se cierra automáticamente y el archivo BAI se copia en tu depósito de Cloud Storage.

    gcloud alpha genomics pipelines run \
        --regions us-east1 \
        --command-line 'samtools index ${BAM} ${BAI}' \
        --docker-image "gcr.io/genomics-tools/samtools" \
        --inputs BAM=gs://genomics-public-data/NA12878.chr20.sample.bam \
        --outputs BAI=${BUCKET}/NA12878.chr20.sample.bam.bai
    

    Si se completa correctamente, el comando muestra lo siguiente:

    Running [projects/PROJECT_ID/operations/OPERATION_ID]
    
  4. La canalización tardará unos minutos en finalizar. Puedes ejecutar el siguiente comando para hacer un seguimiento de su estado. Reemplaza OPERATION_ID con el valor impreso en el paso anterior.

    gcloud alpha genomics operations wait OPERATION_ID
    

    Después de que la operación finalice, imprimirá el mensaje siguiente:

    Waiting for [projects/PROJECT_ID/operations/OPERATION_ID]...done.
    
  5. Verifica que se haya generado el archivo BAI:

    gsutil ls ${BUCKET}
    

    El comando debería mostrar lo siguiente:

    gs://BUCKET/NA12878.chr20.sample.bam.bai
    

Acabas de ejecutar una canalización con la API de Pipelines para crear un archivo BAI a partir de un archivo BAM.

Limpiar

  1. Utiliza el comando gsutil rm para borrar el archivo BAI:

    gsutil rm ${BUCKET}/NA12878.chr20.sample.bam.bai
    
  2. Si creaste el depósito específicamente para esta guía de inicio rápido y ya no lo necesitas, bórralo mediante el comando gsutil rb:

    gsutil rb ${BUCKET}
    

¿Qué sigue?

¿Te ha resultado útil esta página? Enviar comentarios:

Enviar comentarios sobre...