Conjuntos de dados públicos do Cloud Life Sciences

O Cloud Life Sciences fornece uma variedade de conjuntos de dados públicos que podem ser acessados gratuitamente e integrados aos aplicativos. O Google hospeda esses conjuntos de dados, fornecendo acesso público aos dados por meio dos seguintes métodos:

  • O acesso interativo está disponível no console do BigQuery. Você pode explorar chamadas de variantes no caso/controle e análise de coorte. Há consultas de amostra (em inglês) para ajudar você a começar. Para informações sobre como dar os primeiros passos com conjuntos de dados públicos no BigQuery, consulte BigQuery public datasets.

  • O acesso a arquivos está disponível no Cloud Storage. Os arquivos estão disponíveis nos formatos BAM, VCF e FASTA. Copie os arquivos de que você precisa para o disco local ou uma VM do Compute Engine para acessar a partir das ferramentas de bioinformática que preferir. Para informações sobre os primeiros passos no Cloud Storage, consulte Como usar conjuntos de dados públicos no Cloud Storage.

Para dados públicos hospedados pela comunidade no Google, cada provedor de dados determina os modos de acesso que eles aceitam.

Conjuntos de dados públicos genômicos do Cloud Life Sciences

Conjuntos de dados públicos de anotações do Cloud Life Sciences

Listar seu conjunto de dados público no Cloud Storage

Se você tiver dúvidas sobre como listar um conjunto de dados público no Cloud Storage, entre em contato conosco pelo e-mail gcp-public-data@google.com.

Listar seu conjunto de dados público no BigQuery

Se você tiver dúvidas sobre como listar um conjunto de dados público no BigQuery, entre em contato conosco pelo e-mail bq-public-data@google.com.