O Cloud Life Sciences fornece uma variedade de conjuntos de dados públicos que podem ser acessados gratuitamente e integrados aos aplicativos. O Google hospeda esses conjuntos de dados, fornecendo acesso público aos dados por meio dos seguintes métodos:
O acesso interativo está disponível no console do BigQuery. Você pode explorar chamadas de variantes no caso/controle e análise de coorte. Há consultas de amostra (em inglês) para ajudar você a começar. Para informações sobre como dar os primeiros passos com conjuntos de dados públicos no BigQuery, consulte BigQuery public datasets.
O acesso a arquivos está disponível no Cloud Storage. Os arquivos estão disponíveis nos formatos BAM, VCF e FASTA. Copie os arquivos de que você precisa para o disco local ou uma VM do Compute Engine para acessar a partir das ferramentas de bioinformática que preferir. Para informações sobre os primeiros passos no Cloud Storage, consulte Como usar conjuntos de dados públicos no Cloud Storage.
Para dados públicos hospedados pela comunidade no Google, cada provedor de dados determina os modos de acesso que eles aceitam.
Conjuntos de dados públicos genômicos do Cloud Life Sciences
- Projeto 1000 Cannabis Genomes
- 1000 Genomes
- Banco de dados de agregação do Genome (gnomAD)
- Platinum Genomes da Illumina
- Banco de dados MSSNG para pesquisadores de autismo
- Genomas de referência
- Projeto da Diversidade do Genoma Humano da Simons Foundation
- The Cancer Genome Atlas (TCGA)
- Pesquisa Aplicável à Terapia para Gerar Tratamentos Eficazes (TARGET, na sigla em inglês)
Conjuntos de dados públicos de anotações do Cloud Life Sciences
- Anotações do ClinVar
- Anotações do COSMIC
- Anotações CVR da Mastermind
- Anotações do Tute
- Anotações da UCSC
Listar seu conjunto de dados público no Cloud Storage
Se você tiver dúvidas sobre como listar um conjunto de dados público no Cloud Storage, entre em contato conosco pelo e-mail gcp-public-data@google.com.
Listar seu conjunto de dados público no BigQuery
Se você tiver dúvidas sobre como listar um conjunto de dados público no BigQuery, entre em contato conosco pelo e-mail bq-public-data@google.com.