Questa pagina mostra un esempio di utilizzo di Apache Hive con Dataproc Metastore completamente gestito di Google Cloud. In questo esempio, avvii una sessione Hive su un cluster Dataproc, quindi esegui comandi di esempio per creare un database e una tabella.
Prima di iniziare
- Crea un servizio Dataproc Metastore.
- Collega il servizio Dataproc Metastore a un cluster Dataproc.
Connettiti ad Apache Hive
Per iniziare a utilizzare Hive, utilizza SSH per connetterti a Dataproc associato al servizio Dataproc Metastore. Una volta stabilita la connessione, puoi eseguire i comandi Hive dalla finestra del terminale SSH nel browser per gestire i metadati.
Per connettersi a Hive
- Nella console Google Cloud, vai alla pagina Istanze VM.
- Nell'elenco delle istanze di macchine virtuali, fai clic su SSH nella riga Istanza VM Dataproc a cui vuoi connetterti.
Nella home directory sul nodo si apre una finestra del browser con un output simile a:
Connected, host fingerprint: ssh-rsa ...
Linux cluster-1-m 3.16.0-0.bpo.4-amd64 ...
...
example-cluster@cluster-1-m:~$
Per avviare Hive e creare un database e una tabella, esegui i seguenti comandi nella sessione SSH:
Avvia Hive.
hive
Crea un database denominato
myDatabase
.create database myDatabase;
Mostra il database che hai creato.
show databases;
Utilizza il database che hai creato.
use myDatabase;
Crea una tabella denominata
myTable
.create table myTable(id int,name string);
Elenca le tabelle sotto
myDatabase
.show tables;
Mostra le righe della tabella che hai creato.
desc MyTable;
L'esecuzione dei seguenti comandi genera un output simile al seguente:
$hive
hive> show databases;
OK
default
hive> create database myDatabase;
OK
hive> use myDatabase;
OK
hive> create table myTable(id int,name string);
OK
hive> show tables;
OK
myTable
hive> desc myTable;
OK
id int
name string