Cloud Life Sciences è ritirato e non sarà più disponibile su Google Cloud dopo l'8 luglio 2025. Ora i casi d'uso di Cloud Life Sciences sono supportati da Batch. Per scoprire come eseguire la migrazione del tuo carico di lavoro, consulta Eseguire la migrazione a Batch.

Questa pagina è stata tradotta dall'API Cloud Translation.

Elaborare i dati genomici utilizzando Cloud Life Sciences

Questa pagina spiega come eseguire una pipeline di genomica che utilizza l'API Cloud Life Sciences per creare un file di indice (file BAI) da un file binario contenente sequenze di DNA (file BAM).

I file BAM sono in genere di grandi dimensioni e la loro lettura può richiedere molto tempo utilizzando un visualizzatore del genoma. Utilizzi un file BAI per individuare le parti del file BAM che contengono la posizione del genoma che ti interessa.

Prima di iniziare

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Go to project selector

Make sure that billing is enabled for your Google Cloud project.

Enable the Cloud Life Sciences, Compute Engine, and Cloud Storage JSON APIs.

Enable the APIs

Install the Google Cloud CLI.

To initialize the gcloud CLI, run the following command:

gcloud init

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Go to project selector

Make sure that billing is enabled for your Google Cloud project.

Enable the Cloud Life Sciences, Compute Engine, and Cloud Storage JSON APIs.

Enable the APIs

Install the Google Cloud CLI.

To initialize the gcloud CLI, run the following command:

gcloud init

In alternativa, puoi utilizzare Cloud Shell, che include gcloud CLI già installato.

Installa Python 3.8.
Se utilizzi Windows e hai lasciato selezionata la casella di controllo pertinente quando hai installato Google Cloud CLI, l'operazione è stata eseguita automaticamente.

esegui la pipeline.

Per eseguire la pipeline, completa i seguenti passaggi:

Crea un bucket in cui archiviare il file BAI. I bucket sono i container di base di Cloud Storage in cui vengono archiviati i dati. Per creare un bucket denominato PROJECT_ID-life-sciences, esegui il comando gcloud storage buckets create:
```
gcloud storage buckets create gs://PROJECT_ID-life-sciences
```
Sostituisci PROJECT_ID con l'ID del tuo progetto Google Cloud. Devi utilizzare un nome bucket univoco a livello globale.
Leggi i requisiti di denominazione dei bucket.
- I nomi dei bucket possono contenere solo lettere minuscole, caratteri numerici, trattini (-) e trattini bassi (_). Gli spazi non sono consentiti.
- I nomi dei bucket devono iniziare e terminare con un numero o con una lettera.
- I nomi dei bucket possono contenere da 3 a 63 caratteri. I nomi che includono punti possono contenere fino a 222 caratteri, ma ogni singolo componente separato da un punto non può essere più lungo di 63 caratteri.
- I nomi dei bucket non possono essere rappresentati da un indirizzo IP con notazione decimale separata da punti (ad esempio 192.168.5.4).
- I nomi dei bucket non possono iniziare con il prefisso "goog".
- I nomi dei bucket non devono contenere la parola "google" o parole simili che potrebbero sembrare errori di digitazione di "google", ad esempio "g00gle".
Attenzione: non inserire informazioni sensibili all'interno del nome del bucket, poiché lo spazio dei nomi dei bucket è globale e visibile pubblicamente.

In caso di esito positivo, il comando restituisce quanto segue:
```
Creating gs://PROJECT_ID-life-sciences
```

Per avviare la pipeline, esegui il comando gcloud beta lifesciences pipelines run:

gcloud beta lifesciences pipelines run \
    --regions us-east1 \
    --command-line 'samtools index ${BAM} ${BAI}' \
    --docker-image "gcr.io/cloud-lifesciences/samtools" \
    --inputs BAM=gs://genomics-public-data/NA12878.chr20.sample.bam \
    --outputs BAI=gs://PROJECT_ID-life-sciences/NA12878.chr20.sample.bam.bai

In caso di esito positivo, il comando restituisce quanto segue:

Running [projects/PROJECT_ID/operations/OPERATION_ID]

Prendi nota del valore OPERATION_ID, che utilizzerai nel passaggio successivo.

Per monitorare lo stato della pipeline, esegui il comando gcloud beta lifesciences operations wait. Sostituisci OPERATION_ID con il valore stampato nel passaggio precedente. Il completamento della pipeline richiede alcuni minuti.
```
gcloud beta lifesciences operations wait OPERATION_ID
```
Al termine dell'operazione, viene restituito il seguente messaggio:
```
Waiting for [projects/PROJECT_ID/operations/OPERATION_ID]...done.
```
Per verificare che il file BAI sia stato generato, esegui il comando gcloud storage ls:
```
gcloud storage ls gs://PROJECT_ID-life-sciences
```
In caso di esito positivo, il comando restituisce quanto segue:
```
gs://PROJECT_ID-life-sciences/NA12878.chr20.sample.bam.bai
```

Hai eseguito una pipeline utilizzando l'API Cloud Life Sciences per creare un file BAI da un file BAM. Utilizza un visualizzatore del genoma per esaminare il file NA12878.chr20.sample.bam BAM utilizzando il file indice NA12878.chr20.sample.bam.bai.

Esegui la pulizia

Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi.

Elimina il file BAI

Per eliminare il file BAI generato, ma mantenere il progetto e il bucket che hai creato, esegui il comando gcloud storage rm:

gcloud storage rm PROJECT_ID-life-sciences/NA12878.chr20.sample.bam.bai

Elimina il bucket

Se hai creato il bucket specificamente per questa guida rapida e non ne hai più bisogno, ma vuoi conservare il progetto, elimina il bucket utilizzando il comando gcloud storage rm. L'eliminazione del bucket comporta anche l'eliminazione del file BAI generato.

gcloud storage rm gs://PROJECT_ID-life-sciences --recursive

Elimina il progetto

Se hai creato il progetto specificamente per questa guida rapida e non ne hai più bisogno, puoi eliminarlo. L'eliminazione del progetto comporta anche l'eliminazione del file BAI e del bucket Cloud Storage.

Attenzione: l'eliminazione di un progetto ha i seguenti effetti:

L'intero contenuto del progetto viene eliminato. Se hai utilizzato un progetto esistente per le attività descritte in questo documento, quando lo elimini elimini anche tutto il lavoro svolto nel progetto.
Gli ID progetto personalizzati non sono più disponibili. Quando hai creato questo progetto, potresti aver creato un ID progetto personalizzato che vuoi utilizzare in futuro. Per conservare gli URL che utilizzano l'ID progetto, ad esempio un URL appspot.com, elimina le risorse selezionate all'interno del progetto anziché eliminare l'intero progetto.

Se intendi esplorare più architetture, tutorial o guide rapide, il riuso dei progetti può aiutarti a non superare i limiti di quota.

In the Google Cloud console, go to the Manage resources page.
Go to Manage resources
In the project list, select the project that you want to delete, and then click Delete.
In the dialog, type the project ID, and then click Shut down to delete the project.

Com'è andata?

Passaggi successivi

Scopri di più sui set di dati pubblici dell'API Cloud Life Sciences.
Scopri come caricare i dati delle varianti in Cloud Storage o BigQuery.
Scopri come analizzare le varianti con BigQuery.