Dataproc에서 Bigtable

Bigtable은 Google의 NoSQL 빅데이터 데이터베이스 서비스입니다. Google 검색, 애널리틱스, 지도, Gmail 등 Google의 수많은 핵심 서비스를 운영하는 바로 그 데이터베이스입니다. Bigtable은 대용량 워크로드에서 지속적으로 낮은 지연 시간과 높은 처리량을 제공하도록 설계되었으므로 IoT, 사용자 분석, 회계 자료 분석 등의 운영 및 분석 애플리케이션에 모두에 적합합니다.

Bigtable은 Apache HBase가 필요한 모든 Apache Spark 또는 Hadoop 사용에 탁월한 옵션입니다. Bigtable은 Apache HBase 1.0+ 및 2.0+ API를 지원하고 Maven의 Bigtable HBase 클라이언트를 제공하므로 Dataproc에서 Bigtable을 사용할 수 있습니다.

Bigtable Spark 커넥터 사용

Bigtable Spark 커넥터를 사용하면 Bigtable에서 데이터를 읽고 쓸 수 있습니다. Spark SQL 및 DataFrame을 사용하여 Spark 애플리케이션 내에서 데이터를 읽을 수 있습니다. 읽기 전용 작업의 경우 Data Boost 서버리스 컴퓨팅을 사용할 수 있습니다. Data Boost는 대용량 작업 및 쿼리의 성능 요구사항을 고려하여 설계되었습니다. 그래서 작업과 쿼리가 실행될 때 애플리케이션 제공 클러스터 트래픽에 영향을 주지 않습니다.

자세한 내용은 Bigtable Spark 커넥터 사용을 참조하세요.

다음 단계

Bigtable 사용에 대한 자세한 내용은 Bigtable 문서를 참조하세요.

Dataproc에서 Bigtable 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.

Bigtable Spark 커넥터 사용

다음 단계

Dataproc에서 Bigtable