Cloud Life Sciences には、さまざまな公開データセットがあり、無料でアクセスしてアプリケーションに統合できます。Google では、これらのデータセットをホストして、次のメソッドを使用したデータへの公開アクセスを提供しています。
BigQuery コンソールで、インタラクティブにアクセスできます。ケース コントロールとコホート分析におけるバリアント呼び出しを使うことができます。サンプルクエリを使ってみることができます。これから初めて BigQuery で公開データセットをご使用いただく方法については、BigQuery の公開データセットをご覧ください。
Cloud Storage からファイルにアクセスできます。ファイル形式は BAM、VCF、FASTA が利用できます。ローカル ディスクまたは Compute Engine VM に必要なファイルをコピーして、使い慣れたバイオインフォマティクス ツールからアクセスできます。Cloud Storage の使用を始める方法については、Cloud Storage の公開データセットの使用方法をご覧ください。
Google のコミュニティでホストされている一般公開データの場合、各データの提供者によってサポートされるアクセスのモードが決定されます。
Cloud Life Sciences のゲノム公開データセット
- カンナビス ゲノム 1000 組プロジェクト
- 1,000 人ゲノム
- Genome Aggregation Database(gnomAD)
- Illumina Platinum Genomes
- 自閉症研究者用の MSSNG データベース
- 基準ゲノム
- Simons Genome Diversity Project
- The Cancer Genome Atlas(TCGA)
- Therapeutically Applicable Research to Generate Effective Treatments (TARGET)
Cloud Life Sciences のアノテーション公開データセット
Cloud Storage の一般公開データセットのリストの表示
Cloud Storage の一般公開データセットのリストを表示する方法について、ご不明な点がありましたら、gcp-public-data@google.com までお問い合わせください。
BigQuery の一般公開データセットのリストの表示
BigQuery の一般公開データセットのリストを表示する方法について、ご不明な点がありましたら、bq-public-data@google.com までお問い合わせください。