English
Deutsch
Español – América Latina
Français
Indonesia
Italiano
Português – Brasil
中文 – 简体
日本語
한국어

お問い合わせ無料で利用開始

Dataproc サービス

このページでは、Dataproc イメージバージョンにより Dataproc クラスタノードで実行されるサービスの一覧を記載します。

すべてのノード

次のサービスは、クラスタ内のすべてのノードで実行されます。

ノードタイプ	サービス	イメージのバージョン	説明
すべてのノード	google-dataproc-agent	すべて	Dataproc からジョブを受け取り、ジョブドライバを起動します。
すべてのノード	google-fluentd	すべて	ログを収集して Logging にプッシュします。

Standard クラスタ

次のサービスは標準クラスタで実行されます。

ノードタイプ	サービス	イメージのバージョン	説明
すべてのノード	hadoop-hdfs-namenode	すべて	HDFS ファイルシステムを管理する
	hadoop-hdfs-secondarynamenode	すべて	NameNode のチェックポイントとして機能します。
	hadoop-mapreduce-historyserver	すべて	MapReduce アプリケーションの履歴情報を提供します。
	hadoop-yarn-resourcemanager	すべて	YARN アプリケーションをスケジューリングし管理します。
	hadoop-yarn-timelineserver	1.3 以降	YARN アプリケーションの履歴情報を提供します。
	hive-metastore	すべて	Hive テーブルのメタデータを管理します。デフォルトでは、Hive テーブルのメタデータストアとして、マスターノードのローカル `mariadb`（イメージバージョン 1.5 未満）または `mysql`（イメージバージョン 1.5 以降）データベースを使用します。デフォルトのデータベースの使用はおすすめしません。これらのデータベースはクラスタのライフサイクルに関連付けられているためです。代わりに、Hive メタストアデータベースとして次のいずれかを使用します（推奨順）。 Dataproc Metastore Cloud SQL インスタンス
	hive-server2	すべて	クライアントから受信した Hive に対するクエリ（主に Beeline シェルクエリ）を処理します。
	mariadb	1.5 未満	Dataproc 1.5 未満のイメージで、Hive メタストアのデフォルトの基盤データベースとして使用されるリレーショナルデータベース。
	mysql	1.5 以降	Dataproc 1.5 以上のイメージで、Hive メタストアのデフォルトの基盤データベースとして使用されるリレーショナルデータベース。
	nfs-kernel-server	1.3 未満	NFS がネットワークファイルシステムです。
	spark-history-server	すべて	Spark アプリケーションの履歴情報を提供します。
すべてのワーカー	hadoop-yarn-nodemanager	すべて	YARN コンテナを起動して管理します。
プライマリワーカーのみ	hadoop-hdfs-datanode	すべて	HDFS ブロックを格納

HA クラスタ

Dataproc の高可用性（HA）クラスタでは、以下に示すように、異なるサービスが異なるマスターノードで実行されます。HA クラスタのワーカーノードサービスは、標準クラスタの場合と同じです。

ノードタイプ	サービス	イメージのバージョン	説明
すべてのマスター	hadoop-hdfs-journalnode	すべて	ジャーナルノードのクォーラムにより、HDFS 名前空間の変更の編集ログが維持されます。フェイルオーバーが発生すると、Standby NameNode が編集ログを読み取り、Active NameNode から制御を取得します。
	hadoop-yarn-resourcemanager	すべて	YARN アプリケーションをスケジューリングし管理します。
	hive-metastore	すべて	Hive テーブルのメタデータを管理します。デフォルトでは、Hive テーブルのメタデータストアとして、マスターノードのローカル `mariadb`（イメージバージョン 1.5 未満）または `mysql`（イメージバージョン 1.5 以降）データベースを使用します。デフォルトのデータベースの使用はおすすめしません。これらのデータベースはクラスタのライフサイクルに関連付けられているためです。代わりに、Hive メタストアデータベースとして次のいずれかを使用します（推奨順）。 Dataproc Metastore Cloud SQL インスタンス
	hive-server2	すべて	クライアントから受信した Hive に対するクエリ（主に Beeline シェルクエリ）を処理します。
	zookeeper-server	すべて	ZooKeeper クォーラムは、分散調整に使用されます。高可用性（HA）クラスタでは、HDFS NameNode と YARN リソースマネージャーのリーダーの選択に使用されます。
マスター 0 とマスター 1 のみ	hadoop-hdfs-namenode	すべて	HDFS ファイルシステムを管理する
マスター 0 とマスター 1 のみ	hadoop-hdfs-zkfc	すべて	ZKFC は、HDFS NameNode で実行される `ZKFailoverController` プロセスです。NameNode の健全性をモニタリングし、フェイルオーバーが発生した場合は ZooKeeper を介してリーダーの選出を管理します。
マスター 0 のみ	hadoop-mapreduce-historyserver	すべて	MapReduce アプリケーションの履歴情報を提供します。
	hadoop-yarn-timelineserver	1.3 以降	YARN アプリケーションの履歴情報を提供します。
	mariadb	1.5 未満	Dataproc 1.5 未満のイメージで、Hive メタストアのデフォルトの基盤データベースとして使用されるリレーショナルデータベース。
	mysql	1.5 以降	Dataproc 1.5 以上のイメージで、Hive メタストアのデフォルトの基盤データベースとして使用されるリレーショナルデータベース。
	nfs-kernel-server	1.3 未満	NFS がネットワークファイルシステムです。
	spark-history-server	すべて	Spark アプリケーションの履歴情報を提供します。

特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。

最終更新日 2024-10-10 UTC。