Dataproc Metastore에서 Apache Hive 사용

이 페이지에서는 Dataproc Metastore 서비스에서 Apache Hive를 사용하는 예시를 보여줍니다. 이 예시에서는 Dataproc 클러스터에서 Hive 세션을 실행하고 샘플 명령어를 실행하여 데이터베이스와 테이블을 만듭니다.

시작하기 전에

Dataproc Metastore 서비스를 만듭니다.
Dataproc Metastore 서비스를 Dataproc 클러스터에 연결합니다.
- Hive metastore 비밀번호를 설정합니다.

Apache Hive에 연결

Hive를 사용하려면 SSH를 사용하여 Dataproc Metastore 서비스와 연결된 Dataproc 클러스터에 연결합니다. 연결되면 브라우저의 SSH 터미널 창에서 Hive 명령어를 실행하여 메타데이터를 관리할 수 있습니다.

Hive에 연결

Google Cloud 콘솔에서 VM 인스턴스 페이지로 이동합니다.
가상 머신 인스턴스 목록에서 연결할 Dataproc VM 인스턴스 행의 SSH를 클릭합니다.

노드의 홈 디렉터리에 다음과 비슷한 출력이 표시된 브라우저 창이 열립니다.

Connected, host fingerprint: ssh-rsa ...
Linux cluster-1-m 3.16.0-0.bpo.4-amd64 ...
...
example-cluster@cluster-1-m:~$

Hive를 시작하고 데이터베이스 및 테이블을 만들려면 SSH 세션에서 다음 명령어를 실행합니다.

Hive를 시작합니다.
```
hive
```
myDatabase라는 데이터베이스를 만듭니다.
```
create database myDatabase;
```
생성한 데이터베이스를 표시합니다.
```
show databases;
```
만든 데이터베이스를 사용합니다.
```
use myDatabase;
```
이름이 myTable인 테이블을 만듭니다.
```
create table myTable(id int,name string);
```
myDatabase 아래의 테이블을 나열합니다.
```
show tables;
```
만든 테이블에 테이블 행을 표시합니다.
```
desc MyTable;
```

다음 명령어를 실행하면 다음과 비슷한 출력이 생성됩니다.

$hive

hive> show databases;
OK
default
hive> create database myDatabase;
OK
hive> use myDatabase;
OK
hive> create table myTable(id int,name string);
OK
hive> show tables;
OK
myTable
hive> desc myTable;
OK
id                      int                                         
name                    string

Dataproc Metastore에서 Apache Hive 사용 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.

시작하기 전에

Apache Hive에 연결

다음 단계

Dataproc Metastore에서 Apache Hive 사용