Ensembles de données publics de Cloud Life Sciences

Cloud Life Sciences fournit plusieurs ensembles de données publics auxquels vous pouvez accéder gratuitement et que vous pouvez intégrer à vos applications. Google héberge ces ensembles de données et fournit un accès public à celles-ci via les méthodes suivantes :

  • L'accès interactif, disponible dans la console BigQuery. Vous pouvez explorer les appels de variantes dans l'analyse de cas/contrôle et de cohorte. Pour vous guider, vous pouvez consulter des exemples de requêtes. Pour découvrir comment faire vos premiers pas avec les ensembles de données publics hébergés dans BigQuery, consultez la page Ensembles de données publics BigQuery.

  • L'accès aux fichiers est disponible depuis Cloud Storage. Les fichiers sont disponibles aux formats BAM, VCF et FASTA. Copiez les fichiers dont vous avez besoin sur votre disque local ou sur une VM Compute Engine pour accéder aux outils bio-informatiques de votre choix. Pour découvrir comment bien démarrer avec Cloud Storage, consultez la section Comment utiliser des ensembles de données publics sur Cloud Storage.

En ce qui concerne les données publiques hébergées par la communauté, chaque fournisseur de données détermine les modes d'accès compatibles.

Ensembles de données de génomique publics de Cloud Life Sciences

Ensembles de données d'annotations publics de Cloud Life Sciences

Répertorier un ensemble de données public sur Cloud Storage

Si vous avez des questions concernant la manière de répertorier un ensemble de données public dans Cloud Storage, contactez-nous à l'adresse gcp-public-data@google.com.

Répertorier un ensemble de données public sur BigQuery

Si vous avez des questions concernant la manière de répertorier un ensemble de données public dans BigQuery, contactez-nous à l'adresse bq-public-data@google.com.