Usar o Apache Hive com o Dataproc Metastore

Nesta página, mostramos um exemplo de uso do Apache Hive com um metastore do Dataproc serviço. Neste exemplo, você inicia uma sessão do Hive em um cluster do Dataproc e executa comandos de exemplo para criar um banco de dados e uma tabela.

Antes de começar

Conectar-se ao Apache Hive

Para começar a usar o Hive, use o SSH para se conectar ao cluster do Dataproc associado ao serviço do Metastore do Dataproc. Uma vez conectado, é possível executar comandos do Hive na janela do terminal SSH no navegador para gerenciar os metadados.

Para se conectar ao Hive

  1. No console do Google Cloud, acesse a VM instâncias.
  2. Na lista de instâncias de máquina virtual, clique em SSH na linha instância de VM do Dataproc à qual você quer se conectar.

Uma janela do navegador é aberta no diretório principal do nó, com uma saída semelhante para o seguinte:

Connected, host fingerprint: ssh-rsa ...
Linux cluster-1-m 3.16.0-0.bpo.4-amd64 ...
...
example-cluster@cluster-1-m:~$

Para iniciar o Hive e criar um banco de dados e uma tabela, execute os seguintes comandos na sessão SSH:

  1. Inicie o Hive.

    hive
    
  2. Crie um banco de dados chamado myDatabase.

    create database myDatabase;
    
  3. Mostre o banco de dados que você criou.

    show databases;
    
  4. Use o banco de dados que você criou.

    use myDatabase;
    
  5. Crie uma tabela denominada myTable.

    create table myTable(id int,name string);
    
  6. Liste as tabelas em myDatabase.

    show tables;
    
  7. Mostre as linhas da tabela que você criou.

    desc MyTable;
    

A execução dos comandos a seguir gera uma saída semelhante a esta:

$hive

hive> show databases;
OK
default
hive> create database myDatabase;
OK
hive> use myDatabase;
OK
hive> create table myTable(id int,name string);
OK
hive> show tables;
OK
myTable
hive> desc myTable;
OK
id                      int                                         
name                    string 

A seguir