Cette page présente un exemple d'utilisation d'Apache Hive avec un service Dataproc Metastore. Dans cet exemple, vous lancez une session Hive sur un cluster Dataproc et exécutez des exemples de commandes pour créer une base de données et une table.
Avant de commencer
- Créez un service Dataproc Metastore.
- Associez le service Dataproc Metastore à un cluster Dataproc.
Se connecter à Apache Hive
Pour commencer à utiliser Hive, vous pouvez vous connecter en SSH au cluster Dataproc associé à votre service Dataproc Metastore. Après vous être connecté en SSH au cluster, vous pouvez exécuter des commandes Hive pour gérer vos métadonnées.
Se connecter à Hive
- Dans la console Google Cloud, accédez à la page Instances de VM.
- Dans la liste des instances de machines virtuelles, cliquez sur SSH sur la ligne de l'instance de VM Dataproc à laquelle vous souhaitez vous connecter.
Une fenêtre de navigateur s'ouvre dans votre répertoire d'accueil sur le nœud et affiche une sortie semblable à celle-ci:
Connected, host fingerprint: ssh-rsa ...
Linux cluster-1-m 3.16.0-0.bpo.4-amd64 ...
...
example-cluster@cluster-1-m:~$
Pour démarrer Hive et créer une base de données et une table, exécutez les commandes suivantes dans la session SSH:
Lancez Hive.
hive
Créez une base de données nommée
myDatabase
.create database myDatabase;
Affichez la base de données que vous avez créée.
show databases;
Utilisez la base de données que vous avez créée.
use myDatabase;
Créez une table appelée
myTable
.create table myTable(id int,name string);
Répertoriez les tables sous
myDatabase
.show tables;
Affichez les lignes de la table que vous avez créée.
desc MyTable;
L'exécution de ces commandes affiche un résultat semblable à celui-ci:
$hive
hive> show databases;
OK
default
hive> create database myDatabase;
OK
hive> use myDatabase;
OK
hive> create table myTable(id int,name string);
OK
hive> show tables;
OK
myTable
hive> desc myTable;
OK
id int
name string