将 Apache Hive 与 Dataproc Metastore 搭配使用

本页面展示了将 Apache Hive 与 Dataproc Metastore 服务结合使用的示例。在此示例中,您将在 Dataproc 集群上启动 Hive 会话,并运行一些示例命令以创建数据库和表。

准备工作

连接到 Apache Hive

如需开始使用 Hive,您可以通过 SSH 连接到与 Dataproc Metastore 服务关联的 Dataproc 集群。之后,通过 SSH 连接到集群,您可以运行 Hive 命令来管理元数据。

连接到 Hive

  1. 在 Google Cloud 控制台中,转到虚拟机实例页面。
  2. 在虚拟机实例列表中,点击要连接的 Dataproc 虚拟机实例行中的 SSH

在该节点上的主目录中打开了一个浏览器窗口,其输出类似于以下内容:

Connected, host fingerprint: ssh-rsa ...
Linux cluster-1-m 3.16.0-0.bpo.4-amd64 ...
...
example-cluster@cluster-1-m:~$

如需启动 Hive 并创建数据库和表,请在 SSH 会话中运行以下命令:

  1. 启动 Hive。

    hive
    
  2. 创建一个名为 myDatabase 的数据库。

    create database myDatabase;
    
  3. 显示您创建的数据库。

    show databases;
    
  4. 使用您创建的数据库。

    use myDatabase;
    
  5. 创建一个名为 myTable 的表。

    create table myTable(id int,name string);
    
  6. 列出 myDatabase 下的表。

    show tables;
    
  7. 在您创建的表格中显示表格行。

    desc MyTable;
    

运行这些命令会显示类似于以下内容的输出:

$hive

hive> show databases;
OK
default
hive> create database myDatabase;
OK
hive> use myDatabase;
OK
hive> create table myTable(id int,name string);
OK
hive> show tables;
OK
myTable
hive> desc myTable;
OK
id                      int
name                    string

后续步骤