Menggunakan Apache Hive dengan Dataproc Metastore

Halaman ini menunjukkan contoh penggunaan Apache Hive dengan layanan Metastore Dataproc. Dalam contoh ini, Anda akan meluncurkan sesi Hive di cluster Dataproc, lalu menjalankan contoh perintah untuk membuat database dan tabel.

Sebelum memulai

Menghubungkan ke Apache Hive

Untuk mulai menggunakan Hive, gunakan SSH untuk terhubung ke cluster Dataproc yang terkait dengan layanan Dataproc Metastore Anda. Setelah terhubung, Anda dapat menjalankan perintah Hive dari jendela terminal SSH di browser untuk mengelola metadata.

Untuk terhubung ke Hive

  1. Di konsol Google Cloud, buka halaman VM Instances.
  2. Dalam daftar instance virtual machine, klik SSH di baris instance VM Dataproc yang ingin Anda hubungkan.

Jendela browser akan terbuka di direktori beranda Anda di node dengan output yang mirip dengan berikut ini:

Connected, host fingerprint: ssh-rsa ...
Linux cluster-1-m 3.16.0-0.bpo.4-amd64 ...
...
example-cluster@cluster-1-m:~$

Untuk memulai Hive dan membuat database serta tabel, jalankan perintah berikut dalam sesi SSH:

  1. Mulai Hive.

    hive
    
  2. Buat database bernama myDatabase.

    create database myDatabase;
    
  3. Tampilkan database yang Anda buat.

    show databases;
    
  4. Gunakan database yang Anda buat.

    use myDatabase;
    
  5. Buat tabel bernama myTable.

    create table myTable(id int,name string);
    
  6. Cantumkan tabel di bagian myDatabase.

    show tables;
    
  7. Menampilkan baris tabel dalam tabel yang Anda buat.

    desc MyTable;
    

Menjalankan perintah berikut akan menghasilkan output yang mirip dengan berikut ini:

$hive

hive> show databases;
OK
default
hive> create database myDatabase;
OK
hive> use myDatabase;
OK
hive> create table myTable(id int,name string);
OK
hive> show tables;
OK
myTable
hive> desc myTable;
OK
id                      int                                         
name                    string 

Langkah selanjutnya