Google Genomics

페타바이트 단위의 게놈 데이터를 효율적으로 처리하여 깊이 있는 연구 질문 고찰

무료로 사용해 보기 백서 다운로드

첨단 과학 연구

Google Genomics는 생명 과학 커뮤니티에서 전 세계의 게놈 정보를 정리하여 사용자에게 제공하도록 돕고 있습니다. 빅 게놈 데이터는 이미 존재하는 상태이며, 페타바이트를 넘어 엑사바이트 단위에 이를 정도로 급증하고 있습니다. Google Cloud Platform 확장을 통해 Google 검색 및 지도를 지원하는 기술을 똑같이 적용해 복잡한 대용량 데이터세트를 안전하게 저장, 처리, 탐색, 공유할 수 있게 되었습니다.

신속한 결과 도출

대규모 연구 프로젝트의 전체 게놈 정보를 쿼리하는 데 몇 초밖에 걸리지 않습니다. 개수의 제한 없이 많은 게놈과 실험을 동시에 처리할 수 있습니다.

프로젝트 지원을 위한 확장

취급하는 게놈이 하나건 백만 개건 상관없이 Google Genomics는 연구 진행에 필요한 기능과 유연성을 제공합니다.

개방성 및 상호 운용성

Google Genomics는 세계 유전학 보건연대(Global Alliance for Genomics and Health)에서 개발한 표준을 포함한 개방형 업계 표준을 지원하여 원하는 경우 선택한 시기에 그룹, 공동작업자, 커뮤니티와 도구 및 데이터를 공유할 수 있습니다.

안정적인 정보 보안

Google 인프라는 HIPAA 요구 사항과 보호되는 건강 관련 정보 요구사항 그 이상을 충족할 수 있는 정보 보안을 안정적으로 제공합니다.

데이터 공유

연구자, 개발자, 건강 관련 기관에 귀중한 역할을 하는 많은 데이터를 생성하고 수집하세요. GCP를 사용하면 운영, 네트워크, 검색 비용을 고객에게 간편하게 청구할 수 있는 저장소 버킷에서 게놈 데이터를 호스팅하여 이러한 데이터의 액세스와 사용을 보다 효과적으로 수익화할 수 있습니다.

Requester Pays Buckets을 설정하는 방법에 대해 알아보세요.

Google Genomics 기능

상호 운용성
Bigtable 및 Spanner와 같은 Google 기술을 기반으로 구현되는 Global Alliance for Genomics and Health의 개방형 표준은 다양한 게놈 저장소에서 상호 운용이 가능합니다.
완전한 통합
Google의 클라우드 인프라는 빠른 가상 머신, 확장형 저장소, 다양한 완전 관리형 SQL 및 NoSQL 데이터베이스(예: Bigtable, Datastore)를 포함하여 생물정보학 요건에 적합합니다.
보안 및 규정 준수
HIPAA BAA(Business Associates Agreement)가 적용됩니다. National Cancer Institute Cancer Cloud Pilots의 FedRAMP ATO를 통해 제공됩니다.
실시간 데이터 처리
Google Genomics의 GATK, Apache Spark 또는 Cloud Dataflow, Grid Engine 클러스터와 함께 일괄적으로 Cloud Datalab을 활용한 문학적 프로그래밍(Literate Programming) 방식을 사용해 BigQuery로 실시간 게놈 데이터를 처리하고 분석합니다.
높은 확장성
페타바이트 단위의 서열 판독, 돌연변이, 기준, 주석을 로드하여 모두 효율적으로 처리할 수 있습니다.

"Google팀이 제공한 통계와 전문성은 비교를 거부하는 최고의 수준이었습니다. Google과의 협업으로 MSSNG 프로젝트의 판도가 달라졌습니다. 자폐증의 원인과 하위 유형을 이해하여 진단 및 치료의 발전을 가져올 중대한 발견을 앞당길 수 있게 되었습니다. ”

— Rob Ring 박사 Autism Speaks

Google Genomics 백서 다운로드

Google Genomics 사용자

생물정보학자

개방형 표준을 사용해 필요한 것은 물론 원하는 것을 만들 수 있습니다.

연구원

연구 기간을 단축하고 새로운 질문을 제시하며 안전한 온라인 환경에서 데이터를 공유할 수 있습니다.

IT

연산 요구 충족, 데이터 보안, 시스템 안정성 보장에 필요한 리소스를 보유했다는 확신을 갖고 안심할 수 있습니다.

"BigQuery 덕분에 이전에는 수십 초에서 심지어 분 단위가 소요되던 매우 복잡한 검색이 4초면 끝납니다. 또한 확장형 시스템에 대한 요구를 충족해 줍니다. ”

— Marc Fiume DNAstack CEO 겸 설립자

Google Genomics 커뮤니티 참여

다른 생물정보학 개발자 및 커뮤니티 리소스로부터 정보를 얻고 오픈소스 프로젝트에 기여하고 기능 요청을 제출하고 자신의 지식과 경험을 공유할 수 있는 다양한 방법을 제공합니다.

토론 참여

Google Genomics에 관한 토론 내용을 읽고 토론에 참여해 보세요.

읽기 및 참여

지원

개발 관련 질문을 하고 문제를 보고하고 Google Genomics에 관해 토론해 보세요.

Google Genomics 지원

Google Genomics 가격

Google Genomics에서는 데이터 저장소에 대한 요금이 부과됩니다. 게놈 데이터의 로딩 및 내보내기는 무료입니다. Google Genomics와 함께 사용한 기타 클라우드 리소스는 표준 요금에 따라 청구됩니다. 자세한 내용은 가격 책정 가이드를 참조하세요.

리소스 가격(US$)
Genomics 저장소* 1GB당 $0.022/월
USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.