Cloud Life Sciences – öffentliche Datasets

Cloud Life Sciences bietet eine Vielzahl öffentlicher Datasets, auf die Sie kostenlos zugreifen und die Sie in Ihre Anwendungen einbinden können. Google hostet diese Datasets und stellt mit den folgenden Methoden öffentlichen Zugriff auf die Daten bereit:

  • Interaktiver Zugriff erfolgt über die BigQuery-Konsole. Sie können Variantenaufrufe in Fall-/Kontroll- und Kohortenanalysen untersuchen. Zum Einstieg stehen Ihnen hilfreiche Beispielabfragen zur Verfügung. Informationen zu den ersten Schritten mit öffentlichen Datasets in BigQuery finden Sie unter Öffentliche BigQuery-Datasets.

  • Dateizugriff erfolgt über Cloud Storage. Die Dateien sind in den Formaten BAM, VCF und FASTA verfügbar. Kopieren Sie die benötigten Dateien auf Ihre lokale Festplatte oder eine Compute Engine-VM, damit Sie über Ihre bevorzugten Bioinformatiktools darauf zugreifen können. Weitere Informationen zu den ersten Schritten mit Cloud Storage finden Sie unter Öffentliche Datasets in Cloud Storage verwenden.

Bei öffentlichen Daten, die von der Community bei Google gehostet werden, werden die unterstützten Zugriffsmodi von jedem Datenanbieter individuell festgelegt.

Cloud Life Sciences – öffentliche genomische Datasets

Cloud Life Sciences – öffentliche Annotations-Datasets

Öffentliche Datasets in Cloud Storage auflisten

Wenn Sie Fragen zur Auflistung eines öffentlichen Datasets in Cloud Storage haben, kontaktieren Sie uns unter gcp-public-data@google.com.

Öffentliche Datasets in BigQuery auflisten

Wenn Sie Fragen zur Auflistung eines öffentlichen Datasets in BigQuery haben, kontaktieren Sie uns unter bq-public-data@google.com.