Cloud Life Sciences는 무료로 액세스하고 애플리케이션에 통합할 수 있는 다양한 공개 데이터세트를 제공합니다. Google은 이러한 데이터세트를 호스팅하며, 다음 방법을 통해 데이터에 대한 공개 액세스 권한을 부여합니다.
BigQuery 콘솔에서 대화형 액세스를 사용할 수 있습니다. 사례/대조군 및 동질 집단 분석에서 변이 추출을 탐색할 수 있습니다. 시작하는 데 도움이 되는 샘플 쿼리가 있습니다. BigQuery에서 공개 데이터 세트로 시작하는 방법에 대한 자세한 내용은 BigQuery 공개 데이터 세트를 참조하세요.
Cloud Storage에서 파일 액세스를 사용할 수 있습니다. 파일은 BAM, VCF, FASTA 형식으로 사용할 수 있습니다. 자주 사용하는 생명정보학 도구에서 액세스할 수 있도록 로컬 디스크 또는 Compute Engine VM에 필요한 파일을 복사합니다. Cloud Storage를 시작하는 방법은 Cloud Storage에서 공개 데이터 세트를 사용하는 방법을 참조하세요.
Google의 커뮤니티에서 호스팅하는 공개 데이터의 경우 각 데이터 제공업체가 지원하는 액세스 모드를 결정합니다.
Cloud Life Sciences 게놈 공개 데이터세트
- 1000 Cannabis 게놈 프로젝트
- 1000 Genomes
- Genome Aggregation Database(gnomAD)
- Illumina Platinum Genomes
- 자폐증 연구자를 위한 MSSNG 데이터베이스
- 참조용 게놈
- Simons Genome Diversity Project
- The Cancer Genome Atlas(TCGA)
- 효과적인 치료를 위한 치료법 적용 연구(TARGET)
Cloud Life Sciences 주석 공개 데이터세트
Cloud Storage에 공개 데이터세트 나열
Cloud Storage에 공개 데이터세트 나열하는 방법에 대해 질문이 있는 경우 gcp-public-data@google.com으로 문의하세요.
BigQuery에 공개 데이터세트 나열
BigQuery에 공개 데이터를 나열하는 방법에 대해 질문이 있는 경우 bq-public-data@google.com으로 문의하세요.