이 페이지에서는 Dataproc Metastore 서비스에서 Apache Hive를 사용하는 예시를 보여줍니다. 이 예시에서는 Dataproc 클러스터에서 Hive 세션을 실행하고 샘플 명령어를 실행하여 데이터베이스와 테이블을 만듭니다.
시작하기 전에
Apache Hive에 연결
Hive를 사용하려면 SSH를 사용하여 Dataproc Metastore 서비스와 연결된 Dataproc 클러스터에 연결합니다. 연결되면 브라우저의 SSH 터미널 창에서 Hive 명령어를 실행하여 메타데이터를 관리할 수 있습니다.
Hive에 연결
- Google Cloud 콘솔에서 VM 인스턴스 페이지로 이동합니다.
- 가상 머신 인스턴스 목록에서 연결할 Dataproc VM 인스턴스 행의 SSH를 클릭합니다.
노드의 홈 디렉터리에 다음과 비슷한 출력이 표시된 브라우저 창이 열립니다.
Connected, host fingerprint: ssh-rsa ...
Linux cluster-1-m 3.16.0-0.bpo.4-amd64 ...
...
example-cluster@cluster-1-m:~$
Hive를 시작하고 데이터베이스 및 테이블을 만들려면 SSH 세션에서 다음 명령어를 실행합니다.
Hive를 시작합니다.
hive
myDatabase
라는 데이터베이스를 만듭니다.create database myDatabase;
생성한 데이터베이스를 표시합니다.
show databases;
만든 데이터베이스를 사용합니다.
use myDatabase;
이름이
myTable
인 테이블을 만듭니다.create table myTable(id int,name string);
myDatabase
아래의 테이블을 나열합니다.show tables;
만든 테이블에 테이블 행을 표시합니다.
desc MyTable;
다음 명령어를 실행하면 다음과 비슷한 출력이 생성됩니다.
$hive
hive> show databases;
OK
default
hive> create database myDatabase;
OK
hive> use myDatabase;
OK
hive> create table myTable(id int,name string);
OK
hive> show tables;
OK
myTable
hive> desc myTable;
OK
id int
name string