Cette page présente un exemple d'utilisation d'Apache Hive avec un service Dataproc Metastore. Dans cet exemple, vous lancez une session Hive sur un cluster Dataproc, puis exécutez des exemples de commandes pour créer une base de données et une table.
Avant de commencer
- Créez un service Dataproc Metastore.
- associer le service Dataproc Metastore à un cluster Dataproc ;
Se connecter à Apache Hive
Pour commencer à utiliser Hive, utilisez SSH pour vous connecter au cluster Dataproc associé à votre service Dataproc Metastore. Une fois connecté, vous pouvez exécuter des commandes Hive depuis la fenêtre du terminal SSH dans votre navigateur pour gérer vos métadonnées.
Pour vous connecter à Hive
- Dans la console Google Cloud, accédez à la page Instances de VM.
- Dans la liste des instances de machine virtuelle, cliquez sur SSH sur la ligne de l'instance de VM Dataproc à laquelle vous souhaitez vous connecter.
Une fenêtre de navigateur s'ouvre dans votre répertoire d'accueil sur le nœud, avec un résultat semblable comme suit:
Connected, host fingerprint: ssh-rsa ...
Linux cluster-1-m 3.16.0-0.bpo.4-amd64 ...
...
example-cluster@cluster-1-m:~$
Pour démarrer Hive et créer une base de données et une table, exécutez les commandes suivantes dans la session SSH:
Démarrez Hive.
hive
Créez une base de données nommée
myDatabase
.create database myDatabase;
Affichez la base de données que vous avez créée.
show databases;
Utilisez la base de données que vous avez créée.
use myDatabase;
Créez une table nommée
myTable
.create table myTable(id int,name string);
Répertoriez les tables sous
myDatabase
.show tables;
Affichez les lignes de la table que vous avez créée.
desc MyTable;
L'exécution des commandes suivantes génère un résultat semblable à celui-ci :
$hive
hive> show databases;
OK
default
hive> create database myDatabase;
OK
hive> use myDatabase;
OK
hive> create table myTable(id int,name string);
OK
hive> show tables;
OK
myTable
hive> desc myTable;
OK
id int
name string