Dataproc과 Cloud Bigtable

Cloud Bigtable은 Google의 NoSQL 빅데이터 데이터베이스 서비스입니다. Google 검색, 애널리틱스, 지도, Gmail 등 Google의 수많은 핵심 서비스를 운영하는 바로 그 데이터베이스입니다. Bigtable은 대용량 작업에서 지속적으로 낮은 지연 시간과 높은 처리량을 제공하도록 설계되었으므로 IoT, 사용자 분석, 회계 자료 분석 등의 운영 및 분석 애플리케이션에 모두에 적합합니다.

Cloud Bigtable은 Apache HBase가 필요한 모든 Apache Spark 또는 Hadoop 사용에 탁월한 옵션입니다. Cloud Bigtable은 Apache HBase 1.0+ API를 지원하고 Maven의 Cloud Bigtable HBase 클라이언트를 제공하므로 Dataproc과 함께 Cloud Bigtable을 손쉽게 사용할 수 있습니다.

Dataproc와 함께 Cloud Bigtable 사용

Dataproc와 함께 Cloud Bigtable을 사용하는 Spark의 예시는 Cloud Bigtable 디렉터리의 GitHub의 java-docs-samples 저장소에서 확인할 수 있습니다.

이 예시를 실행하려면 Spark 예시의 지침을 따르세요. 시작하려면 java-docs-samples GitHub 저장소를 클론합니다.

git clone https://github.com/GoogleCloudPlatform/java-docs-samples.git
cd java-docs-samples/bigtable/spark

추가 정보