Dataproc Metastore에서 Apache Hive 사용

이 페이지에서는 Dataproc Metastore 서비스에서 Apache Hive를 사용하는 예시를 보여줍니다. 이 예시에서는 Dataproc 클러스터에서 Hive 세션을 실행하고 몇 가지 샘플 명령어를 실행하여 데이터베이스와 테이블을 만듭니다.

시작하기 전에

Apache Hive에 연결

Hive 사용을 시작하려면 Dataproc Metastore 서비스와 연결된 Dataproc 클러스터에 SSH로 연결하면 됩니다. 그런 다음 클러스터에 SSH로 연결하고 Hive 명령어를 실행하여 메타데이터를 관리할 수 있습니다.

Hive에 연결

  1. Google Cloud 콘솔에서 VM 인스턴스 페이지로 이동합니다.
  2. 가상 머신 인스턴스 목록에서 연결할 Dataproc VM 인스턴스 행의 SSH를 클릭합니다.

노드의 홈 디렉터리에 다음과 비슷한 출력이 표시된 브라우저 창이 열립니다.

Connected, host fingerprint: ssh-rsa ...
Linux cluster-1-m 3.16.0-0.bpo.4-amd64 ...
...
example-cluster@cluster-1-m:~$

Hive를 시작하고 데이터베이스와 테이블을 만들려면 SSH 세션에서 다음 명령어를 실행합니다.

  1. Hive를 시작합니다.

    hive
    
  2. myDatabase라는 데이터베이스를 만듭니다.

    create database myDatabase;
    
  3. 생성한 데이터베이스를 표시합니다.

    show databases;
    
  4. 생성한 데이터베이스를 사용합니다.

    use myDatabase;
    
  5. myTable이라는 테이블을 만듭니다.

    create table myTable(id int,name string);
    
  6. myDatabase 아래의 테이블을 나열합니다.

    show tables;
    
  7. 생성한 테이블의 테이블 행을 표시합니다.

    desc MyTable;
    

이러한 명령어를 실행하면 다음과 비슷한 출력이 표시됩니다.

$hive

hive> show databases;
OK
default
hive> create database myDatabase;
OK
hive> use myDatabase;
OK
hive> create table myTable(id int,name string);
OK
hive> show tables;
OK
myTable
hive> desc myTable;
OK
id                      int
name                    string

다음 단계