Esta página mostra um exemplo de uso do Apache Hive com um serviço do metastore do Dataproc. Neste exemplo, você inicia uma sessão do Hive em um cluster do Dataproc e executa comandos de exemplo para criar um banco de dados e uma tabela.
Antes de começar
- Crie um serviço Metastore do Dataproc.
- Anexe o serviço Metastore do Dataproc a um cluster do Dataproc.
Conectar-se ao Apache Hive
Para começar a usar o Hive, use o SSH para se conectar ao cluster do Dataproc associado ao serviço do Metastore do Dataproc. Depois de conectado, é possível executar comandos do Hive na janela do terminal SSH no navegador para gerenciar os metadados.
Para se conectar ao Hive
- No console do Google Cloud, acesse a página Instâncias de VM.
- Na lista de instâncias de máquina virtual, clique em SSH na linha da instância do Dataproc VM à qual você quer se conectar.
Uma janela de navegador é aberta no diretório inicial do nó com uma saída semelhante a esta:
Connected, host fingerprint: ssh-rsa ...
Linux cluster-1-m 3.16.0-0.bpo.4-amd64 ...
...
example-cluster@cluster-1-m:~$
Para iniciar o Hive e criar um banco de dados e uma tabela, execute os seguintes comandos na sessão SSH:
Inicie o Hive.
hive
Crie um banco de dados chamado
myDatabase
.create database myDatabase;
Mostre o banco de dados que você criou.
show databases;
Use o banco de dados que você criou.
use myDatabase;
Crie uma tabela denominada
myTable
.create table myTable(id int,name string);
Liste as tabelas em
myDatabase
.show tables;
Mostre as linhas da tabela que você criou.
desc MyTable;
A execução dos comandos a seguir gera uma saída semelhante a esta:
$hive
hive> show databases;
OK
default
hive> create database myDatabase;
OK
hive> use myDatabase;
OK
hive> create table myTable(id int,name string);
OK
hive> show tables;
OK
myTable
hive> desc myTable;
OK
id int
name string