Utilizzo di Apache Hive con Dataproc Metastore

Questa pagina mostra un esempio di utilizzo di Apache Hive con un servizio Dataproc Metastore. In questo esempio, avvii una sessione Hive su un cluster Dataproc ed esegui alcuni comandi di esempio per creare un database e una tabella.

Prima di iniziare

Connettiti ad Apache Hive

Per iniziare a utilizzare Hive, puoi connetterti al cluster Dataproc associato al servizio Dataproc Metastore tramite SSH. Dopo aver eseguito l'accesso tramite SSH al cluster, puoi eseguire i comandi Hive per gestire i metadati.

Per connettersi a Hive

  1. Nella console Google Cloud, vai alla pagina Istanze VM.
  2. Nell'elenco delle istanze di macchine virtuali, fai clic su SSH nella riga dell'istanza VM Dataproc a cui vuoi connetterti.

Si apre una finestra del browser nella home directory sul nodo con un output simile al seguente:

Connected, host fingerprint: ssh-rsa ...
Linux cluster-1-m 3.16.0-0.bpo.4-amd64 ...
...
example-cluster@cluster-1-m:~$

Per avviare Hive e creare un database e una tabella, esegui questi comandi nella sessione SSH:

  1. Avvia Hive.

    hive
    
  2. Crea un database denominato myDatabase.

    create database myDatabase;
    
  3. Mostra il database che hai creato.

    show databases;
    
  4. Utilizza il database che hai creato.

    use myDatabase;
    
  5. Crea una tabella denominata myTable.

    create table myTable(id int,name string);
    
  6. Elenca le tabelle in myDatabase.

    show tables;
    
  7. Mostra le righe della tabella che hai creato.

    desc MyTable;
    

L'esecuzione di questi comandi mostra un output simile al seguente:

$hive

hive> show databases;
OK
default
hive> create database myDatabase;
OK
hive> use myDatabase;
OK
hive> create table myTable(id int,name string);
OK
hive> show tables;
OK
myTable
hive> desc myTable;
OK
id                      int
name                    string

Passaggi successivi