Dataproc Solr コンポーネント

Dataproc クラスタを作成する際には、オプション コンポーネント機能を使用して、追加コンポーネントをインストールできます。このページでは、Solr コンポーネントについて説明します。

Apache Solr コンポーネントは、オープンソースのエンタープライズ検索プラットフォームです。Solr サーバーとウェブ UI は、クラスタのマスターノードのポート 8983 で使用できます。

Solr ファイルを永続化する: デフォルトでは、Solr は HDFS にあるインデックスとトランザクションのログファイルの書き込みと読み取りを行います。Solr ファイルを永続化するには、コンポーネントをインストールする際に dataproc:solr.gcs.path クラスタ プロパティを設定して Cloud Storage パスを Solr のホーム ディレクトリとして使用します。

コンポーネントをインストールする

Dataproc クラスタの作成時にコンポーネントをインストールします。 Dataproc バージョン 1.3 以降で作成されたクラスタには、コンポーネントを追加できます。

Dataproc イメージの各リリースに含まれるコンポーネント バージョンについては、サポートされる Dataproc バージョンをご覧ください。

gcloud コマンド

Solr コンポーネントを含む Dataproc クラスタを作成するには、--optional-components フラグを指定した gcloud beta dataproc clusters create cluster-name コマンドを使用します。以下のサンプル コマンドでは、オプションの properties フラグを使用して、Cloud Storage パスを Solr ホーム ディレクトリとして設定します。

gcloud beta dataproc clusters create cluster-name \
    --region=region \
    --optional-components=SOLR \
    --enable-component-gateway \
    ... other flags
--properties="dataproc:solr.gcs.path=gcs://bucket-name/" クラスタ プロパティgcloud beta dataproc clusters create コマンドに追加して、Solr ドキュメントが保存される場所(Solr のホーム ディレクトリ)に、Cloud Storage バケットを設定します。

REST API

Solr コンポーネントは、clusters.create リクエストの一部として SoftwareConfig.Component を使用して Dataproc API で指定できます。

コンソール

現在、Cloud Console からの Solr コンポーネントのインストールはサポートされていません。