Cloud Life Sciences 提供了各种公共数据集,可供您访问并集成到您的应用中。Google 托管这些数据集,并通过以下方法提供对数据的公开访问权限:
BigQuery 控制台支持互动式访问。您可以在案例/控制和同类群组分析中探索变体调用。参考样本查询有助于入门。如需了解如何开始使用 BigQuery 中的公共数据集,请参阅 BigQuery 公共数据集。
Cloud Storage 支持文件访问。文件以 BAM、VCF 和 FASTA 格式提供。将需要的文件复制到本地磁盘或 Compute Engine 虚拟机,以便使用您喜爱的生物信息学工具进行访问。如需了解如何开始使用 Cloud Storage,请参阅如何使用 Cloud Storage 上的公共数据集。
对于在 Google 社区上托管的公开数据,则由各数据提供商自行确定他们支持的访问模式。
Cloud Life Sciences 基因组公共数据集
- 1000 Cannabis Genomes Project
- 1000 Genomes
- Genome Aggregation Database (gnomAD)
- Illumina Platinum Genomes
- MSSNG Database for Autism Researchers
- Reference Genomes
- Simons Genome Diversity Project
- The Cancer Genome Atlas (TCGA)
- Therapeutically Applicable Research to Generate Effective Treatments (TARGET)
Cloud Life Sciences 注释公共数据集
列出您在 Cloud Storage 上的公共数据集
如果您对于列出 Cloud Storage 上的公开数据集存有任何疑问,请通过 gcp-public-data@google.com 与我们联系。
列出您在 BigQuery 上的公开数据集
如果您对于列出 BigQuery 上的公共数据集存有任何疑问,请通过 bq-public-data@google.com 与我们联系。