Dataproc Metastore で Apache Hive を使用する

このページでは、Dataproc Metastore サービスで Apache Hive を使用する例を示します。この例では、Dataproc クラスタで Hive セッションを起動し、いくつかのサンプル コマンドを実行してデータベースとテーブルを作成します。

準備

Apache Hive に接続する

Hive の使用を開始するには、Dataproc Metastore サービスに関連付けられている Dataproc クラスタに SSH 接続します。クラスタに SSH 接続したら、Hive コマンドを実行してメタデータを管理できます。

Hive に接続するには

  1. Google Cloud コンソールで、[VM インスタンス] ページに移動します。
  2. 仮想マシン インスタンスのリストで、接続する Dataproc VM インスタンスの行にある [SSH] をクリックします。

ノード上のホーム ディレクトリでブラウザ ウィンドウが開き、次のような出力が表示されます。

Connected, host fingerprint: ssh-rsa ...
Linux cluster-1-m 3.16.0-0.bpo.4-amd64 ...
...
example-cluster@cluster-1-m:~$

Hive を起動してデータベースとテーブルを作成するには、SSH セッションで次のコマンドを実行します。

  1. Hive を起動します。

    hive
    
  2. myDatabase という名前のデータベースを作成します。

    create database myDatabase;
    
  3. 作成したデータベースを表示します。

    show databases;
    
  4. 作成したデータベースを使用します。

    use myDatabase;
    
  5. テーブルを myTable という名前で作成します。

    create table myTable(id int,name string);
    
  6. myDatabase 内のテーブルを一覧表示します。

    show tables;
    
  7. 作成したテーブルのテーブル行を表示します。

    desc MyTable;
    

これらのコマンドを実行すると、次のような出力が表示されます。

$hive

hive> show databases;
OK
default
hive> create database myDatabase;
OK
hive> use myDatabase;
OK
hive> create table myTable(id int,name string);
OK
hive> show tables;
OK
myTable
hive> desc myTable;
OK
id                      int
name                    string

次のステップ