Menggunakan Apache Hive dengan Dataproc Metastore

Halaman ini menunjukkan contoh penggunaan Apache Hive dengan layanan Dataproc Metastore. Dalam contoh ini, Anda meluncurkan sesi Hive pada cluster Dataproc dan menjalankan beberapa contoh perintah untuk membuat database serta tabel.

Sebelum memulai

Menghubungkan ke Apache Hive

Untuk mulai menggunakan Hive, Anda dapat menerapkan SSH ke cluster Dataproc yang terkait dengan layanan Dataproc Metastore Anda. Setelah itu, Anda dapat menjalankan SSH ke cluster tersebut, Anda dapat menjalankan perintah Hive untuk mengelola metadata.

Untuk terhubung ke Hive

  1. Di konsol Google Cloud, buka halaman VM Instances.
  2. Dalam daftar instance virtual machine, klik SSH di baris instance VM Dataproc yang ingin dihubungkan.

Jendela browser akan terbuka di direktori utama Anda pada node dengan output yang mirip dengan berikut ini:

Connected, host fingerprint: ssh-rsa ...
Linux cluster-1-m 3.16.0-0.bpo.4-amd64 ...
...
example-cluster@cluster-1-m:~$

Untuk memulai Hive serta membuat database dan tabel, jalankan perintah berikut di sesi SSH:

  1. Mulai Hive.

    hive
    
  2. Buat database dengan nama myDatabase.

    create database myDatabase;
    
  3. Menampilkan database yang telah Anda buat.

    show databases;
    
  4. Menggunakan database yang telah Anda buat.

    use myDatabase;
    
  5. Buat tabel bernama myTable.

    create table myTable(id int,name string);
    
  6. Cantumkan tabel dalam myDatabase.

    show tables;
    
  7. Tampilkan baris tabel dalam tabel yang Anda buat.

    desc MyTable;
    

Menjalankan perintah ini akan menampilkan output yang mirip dengan berikut ini:

$hive

hive> show databases;
OK
default
hive> create database myDatabase;
OK
hive> use myDatabase;
OK
hive> create table myTable(id int,name string);
OK
hive> show tables;
OK
myTable
hive> desc myTable;
OK
id                      int
name                    string

Langkah selanjutnya