Cloud Life Sciences proporciona una variedad de conjuntos de datos públicos a los que puedes acceder de forma gratuita y, además, integrarlos en tus aplicaciones. Google aloja estos conjuntos de datos y provee acceso público a ellos mediante los siguientes métodos:
El acceso interactivo está disponible en la consola de BigQuery. Puedes explorar las llamadas de variantes en análisis de grupo y de control de casos. Hay varias consultas de muestra que pueden ayudarte a comenzar. Para obtener información sobre cómo comenzar con los conjuntos de datos públicos en BigQuery, consulta Conjuntos de datos públicos de BigQuery.
El acceso a archivos está disponible mediante Cloud Storage. Los archivos están disponibles en los formatos BAM, VCF y FASTA. Copia los archivos que necesitas en tu disco local o en una VM de Compute Engine para acceder desde tus herramientas bioinformáticas favoritas. Para obtener información acerca de cómo comenzar con Cloud Storage, consulta Cómo usar conjuntos de datos públicos en Cloud Storage.
En el caso de los datos públicos alojados por la comunidad en Google, cada proveedor de datos determina sus modos de acceso.
Conjuntos de datos públicos genómicos de Cloud Life Sciences
- Proyecto 1,000 Cannabis Genomes
- 1,000 Genomes
- Genome Aggregation Database (gnomAD)
- Illumina Platinum Genomes
- Base de datos de MSSNG para investigadores del autismo
- Genomas de referencia
- Simons Genome Diversity Project
- Atlas del Genoma del Cáncer (TCGA)
- Therapeutically Applicable Research to Generate Effective Treatments (TARGET)
Conjuntos de datos públicos de anotaciones de Cloud Life Sciences
- Anotaciones de ClinVar
- Anotaciones de COSMIC
- Anotaciones de Mastermind CVR
- Anotaciones de Tute
- Anotaciones de la UCSC
Agrega tu conjunto de datos públicos a Cloud Storage
Si tienes preguntas acerca de cómo agregar un conjunto de datos públicos a Cloud Storage, puedes contactarnos en gcp-public-data@google.com.
Agrega tu conjunto de datos públicos a BigQuery
Si tienes preguntas acerca de cómo agregar un conjunto de datos públicos a BigQuery, puedes contactarnos en bq-public-data@google.com.