Cette page présente un exemple d'utilisation d'Apache Hive avec un service Dataproc Metastore. Dans cet exemple, vous lancez une session Hive sur un cluster Dataproc, puis exécutez des exemples de commandes pour créer une base de données et une table.
Avant de commencer
- Créez un service Dataproc Metastore.
- Associez le service Dataproc Metastore à un cluster Dataproc.
Se connecter à Apache Hive
Pour commencer à utiliser Hive, utilisez SSH pour vous connecter au cluster Dataproc associé à votre service Dataproc Metastore. Une fois connecté, vous pouvez exécuter des commandes Hive à partir de la fenêtre de terminal SSH de votre navigateur pour gérer vos métadonnées.
Pour vous connecter à Hive
- Dans la console Google Cloud, accédez à la page Instances de VM.
- Dans la liste des instances de machine virtuelle, cliquez sur SSH sur la ligne de l'instance de VM Dataproc à laquelle vous souhaitez vous connecter.
Une fenêtre de navigateur s'ouvre dans votre répertoire d'accueil sur le nœud, avec une sortie semblable à celle-ci:
Connected, host fingerprint: ssh-rsa ...
Linux cluster-1-m 3.16.0-0.bpo.4-amd64 ...
...
example-cluster@cluster-1-m:~$
Pour démarrer Hive et créer une base de données et une table, exécutez les commandes suivantes dans la session SSH:
Démarrez Hive.
hive
Créez une base de données nommée
myDatabase
.create database myDatabase;
Affichez la base de données que vous avez créée.
show databases;
Utilisez la base de données que vous avez créée.
use myDatabase;
Créez une table nommée
myTable
.create table myTable(id int,name string);
Répertoriez les tables sous
myDatabase
.show tables;
Affichez les lignes du tableau que vous avez créé.
desc MyTable;
L'exécution des commandes suivantes génère un résultat semblable à celui-ci:
$hive
hive> show databases;
OK
default
hive> create database myDatabase;
OK
hive> use myDatabase;
OK
hive> create table myTable(id int,name string);
OK
hive> show tables;
OK
myTable
hive> desc myTable;
OK
id int
name string