Integrasi dengan Bigtable
Halaman ini menjelaskan integrasi antara Bigtable dan produk serta layanan lainnya.
Layanan
Bagian ini menjelaskan layanan Google Cloud yang terintegrasi dengan Bigtable.
BigQuery
BigQuery adalah data warehouse analisis berharga terjangkau yang terkelola sepenuhnya dan berskala petabyte dari Google. Anda dapat menggunakan BigQuery dengan Bigtable untuk tujuan berikut:
Anda dapat membuat tabel eksternal BigQuery, lalu menggunakannya untuk membuat kueri tabel Bigtable dan menggabungkan data ke tabel BigQuery lainnya. Untuk mengetahui informasi selengkapnya, lihat Membuat kueri data Bigtable.
Anda dapat mengekspor data BigQuery ke tabel Bigtable menggunakan ETL terbalik (RETL) dari BigQuery ke Bigtable. Untuk mengetahui informasi selengkapnya, lihat Mengekspor data ke Bigtable.
Inventaris Aset Cloud
Inventaris Aset Cloud, yang menyediakan layanan inventaris berdasarkan database deret waktu, mendukung dan menampilkan jenis resource Bigtable. Untuk daftar lengkap, lihat Jenis resource yang didukung.
Data Catalog
Data Catalog adalah fitur Dataplex yang secara otomatis membuat katalog metadata tentang resource Bigtable. Informasi Data Catalog tentang data Anda dapat membantu memfasilitasi analisis, penggunaan kembali data, pengembangan aplikasi, dan pengelolaan data. Untuk mengetahui informasi selengkapnya, lihat Mengelola aset data menggunakan Data Catalog.
Dataflow
Dataflow adalah layanan cloud dan model pemrograman untuk pemrosesan big data. Dataflow mendukung pemrosesan batch dan streaming. Anda dapat menggunakan Dataflow untuk memproses data yang disimpan di Bigtable atau untuk menyimpan output pipeline Dataflow Anda. Anda juga dapat menggunakan template Dataflow untuk mengekspor dan import data sebagai Avro, Parquet, atau SequenceFiles.
Untuk memulai, lihat Konektor Bigtable Beam.
Anda juga dapat menggunakan Bigtable sebagai pencarian nilai kunci untuk memperkaya data dalam pipeline. Untuk mengetahui ringkasannya, lihat Memperkaya data streaming. Untuk tutorial, lihat Menggunakan Apache Beam dan Bigtable untuk memperkaya data.
Dataproc
Dataproc menyediakan Apache Hadoop dan produk terkait sebagai layanan terkelola di cloud. Dengan Dataproc, Anda dapat menjalankan tugas Hadoop yang membaca dari dan menulis ke Bigtable.
Untuk contoh tugas Hadoop MapReduce yang menggunakan Bigtable, lihat direktori /java/dataproc-wordcount
di repositori GitHub GoogleCloudPlatform/cloud-bigtable-examples.
Vector Search Vertex AI
Vertex AI Vector Search adalah teknologi yang dapat menelusuri miliaran item yang memiliki kemiripan atau keterkaitan semantik. Hal ini berguna untuk menerapkan mesin rekomendasi, chatbot, dan klasifikasi teks.
Anda dapat menggunakan Bigtable untuk menyimpan penyematan vektor, mengekspornya ke dalam
indeks Vector Search, lalu membuat kueri indeks untuk item serupa. Untuk
tutorial yang menunjukkan contoh alur kerja, lihat Bigtable ke Ekspor Vertex AI Vector Search di repositori GitHub workflows-demos
.
Anda juga dapat mendorong update streaming agar indeks penelusuran vektor tetap sinkron dengan Bigtable secara real time. Untuk mengetahui informasi selengkapnya, lihat Aliran perubahan Bigtable ke template Pencarian Vektor.
Big Data
Bagian ini menjelaskan produk Big Data yang terintegrasi dengan Bigtable.
Apache Beam
Apache Beam adalah model terpadu untuk menentukan pipeline pemrosesan paralel data
batch dan streaming. Konektor Bigtable Beam (BigtableIO
) membantu Anda melakukan operasi batch dan streaming pada data Bigtable dalam pipeline.
Untuk tutorial yang menunjukkan cara menggunakan konektor Bigtable Beam untuk men-deploy pipeline data ke Dataflow, lihat Memproses streaming perubahan Bigtable.
Apache Hadoop
Apache Hadoop adalah framework yang memungkinkan pemrosesan terdistribusi set data besar di seluruh cluster komputer. Anda dapat menggunakan Dataproc untuk membuat cluster Hadoop, lalu menjalankan tugas MapReduce yang membaca dari dan menulis ke Bigtable.
Untuk contoh tugas Hadoop MapReduce yang menggunakan Bigtable, lihat direktori /java/dataproc-wordcount
di repositori GitHub GoogleCloudPlatform/cloud-bigtable-examples.
Kolektor Data StreamSets
StreamSets Data Collector adalah aplikasi streaming data yang dapat Anda konfigurasi untuk menulis data ke Bigtable. StreamSets menyediakan library Bigtable di repositori GitHub-nya di streamsets/datacollector.
Database grafik
Bagian ini menjelaskan database grafik yang terintegrasi dengan Bigtable.
HGraphDB
HGraphDB adalah lapisan klien untuk menggunakan Apache HBase atau Bigtable sebagai database grafik. Class ini mengimplementasikan antarmuka Apache TinkerPop 3.
Untuk informasi selengkapnya tentang cara menjalankan HGraphDB dengan dukungan Bigtable, lihat dokumentasi HGraphDB.
JanusGraph
JanusGraph adalah database grafik yang skalabel. Graph ini dioptimalkan untuk menyimpan dan membuat kueri grafik yang berisi ratusan miliar vertex dan tepi.
Untuk informasi selengkapnya tentang cara menjalankan JanusGraph dengan dukungan Bigtable, lihat Menjalankan JanusGraph dengan Bigtable atau dokumentasi JanusGraph.
Pengelolaan infrastruktur
Bagian ini menjelaskan alat pengelolaan infrastruktur yang terintegrasi dengan Bigtable.
Pivotal Cloud Foundry
Pivotal Cloud Foundry adalah platform deployment dan pengembangan aplikasi yang menawarkan kemampuan untuk mengikat aplikasi ke Bigtable.
Terraform
Terraform adalah alat open source yang mengodifikasi API menjadi file konfigurasi deklaratif. File ini dapat dibagikan kepada anggota tim, diperlakukan sebagai kode, diedit, ditinjau, dan dibuatkan versi.
Untuk mengetahui informasi selengkapnya tentang cara menggunakan Bigtable dengan Terraform, lihat Instance Bigtable dan Tabel Bigtable dalam dokumentasi Terraform.
Database dan pemantauan deret waktu
Bagian ini menjelaskan database deret waktu dan alat pemantauan yang terintegrasi dengan Bigtable.
Heroik
Heroic adalah sistem pemantauan dan database deret waktu. Heroic dapat menggunakan Bigtable untuk menyimpan datanya.
Untuk informasi selengkapnya tentang Heroic, lihat repositori GitHub spotify/heroic, serta dokumentasi untuk mengonfigurasi Bigtable dan mengonfigurasi metrik.
OpenTSDB
OpenTSDB adalah database deret waktu yang dapat menggunakan Bigtable untuk penyimpanan. Dokumentasi OpenTSDB memberikan informasi untuk membantu Anda memulai.