Auf dieser Seite finden Sie ein Beispiel für die Verwendung von Apache Hive mit einem Dataproc Metastore-Dienst. In diesem Beispiel starten Sie eine Hive-Sitzung in einem Dataproc-Cluster und führen dann Beispielbefehle aus, um eine Datenbank und eine Tabelle zu erstellen.
Hinweise
- Erstellen Sie einen Dataproc Metastore-Dienst.
- Dataproc Metastore-Dienst an einen Dataproc-Cluster anhängen
Verbindung zu Apache Hive herstellen
Wenn Sie Hive verwenden möchten, stellen Sie mit SSH eine Verbindung zum Dataproc-Cluster her, der mit Ihrem Dataproc Metastore-Dienst verknüpft ist. Sobald die Verbindung hergestellt ist, können Sie Hive-Befehle über das SSH-Terminalfenster in Ihrem Browser ausführen, um Ihre Metadaten zu verwalten.
Mit Hive verbinden
- Rufen Sie in der Google Cloud Console die Seite VM-Instanzen auf.
- Klicken Sie in der Liste der VM-Instanzen in der Zeile der Dataproc-VM-Instanz, zu der Sie eine Verbindung herstellen möchten, auf SSH.
Im Stammverzeichnis des Knotens wird ein Browserfenster mit einer Ausgabe ähnlich der folgenden geöffnet:
Connected, host fingerprint: ssh-rsa ...
Linux cluster-1-m 3.16.0-0.bpo.4-amd64 ...
...
example-cluster@cluster-1-m:~$
Führen Sie die folgenden Befehle in der SSH-Sitzung aus, um Hive zu starten und eine Datenbank und Tabelle zu erstellen:
Starten Sie Hive.
hive
Erstellen Sie eine Datenbank mit dem Namen
myDatabase
.create database myDatabase;
Zeige die Datenbank an, die du erstellt hast.
show databases;
Verwenden Sie die Datenbank, die Sie erstellt haben.
use myDatabase;
Erstellen Sie eine Tabelle mit dem Namen
myTable
.create table myTable(id int,name string);
Listen Sie die Tabellen unter
myDatabase
auf.show tables;
Die Tabellenzeilen in der von Ihnen erstellten Tabelle anzeigen
desc MyTable;
Wenn Sie die folgenden Befehle ausführen, wird eine Ausgabe generiert, die etwa so aussieht:
$hive
hive> show databases;
OK
default
hive> create database myDatabase;
OK
hive> use myDatabase;
OK
hive> create table myTable(id int,name string);
OK
hive> show tables;
OK
myTable
hive> desc myTable;
OK
id int
name string