Dataproc クラスタを作成する際には、オプション コンポーネント機能を使用して、Solr などの追加コンポーネントをインストールできます。このページでは、Solr コンポーネントについて説明します。
Apache Solr コンポーネントは、オープンソースのエンタープライズ検索プラットフォームです。Solr サーバーとウェブ UI は、クラスタのマスターノードのポート 8983
で使用できます。
Solr ファイルを永続化する: デフォルトでは、Solr は HDFS にあるインデックスとトランザクションのログファイルの書き込みと読み取りを行います。Solr ファイルを永続化するには、コンポーネントをインストールする際に dataproc:solr.gcs.path
クラスタ プロパティを設定して Cloud Storage パスを Solr のホーム ディレクトリとして使用します。
コンポーネントをインストールする
Dataproc クラスタの作成時にコンポーネントをインストールします。 Dataproc バージョン 1.3 以降で作成されたクラスタには、コンポーネントを追加できます。
Dataproc イメージの各リリースに含まれるコンポーネント バージョンについては、サポートされる Dataproc バージョンをご覧ください。
gcloud コマンド
Solr コンポーネントを含む Dataproc クラスタを作成するには、--optional-components
フラグを指定した gcloud dataproc clusters create cluster-name コマンドを使用します。次のサンプル コマンドでは、オプションの properties
フラグを使用して、Cloud Storage のパスを Solr ホーム ディレクトリとして設定します。
gcloud dataproc clusters create cluster-name \ --region=region \ --optional-components=SOLR \ --enable-component-gateway \ ... other flags
--properties="dataproc:solr.gcs.path=gs://bucket-name/"
クラスタ プロパティを gcloud dataproc clusters create
コマンドに追加して、Solr ドキュメントが保存される場所(Solr のホーム ディレクトリ)に、Cloud Storage バケットを設定します。REST API
Solr コンポーネントは、clusters.create リクエストの一部として SoftwareConfig.Component を使用して Dataproc API で指定できます。
Console
- コンポーネントとコンポーネント ゲートウェイを有効にします。
- Google Cloud コンソールで、Dataproc の [クラスタの作成] ページを開きます。[クラスターを設定] パネルが選択されています。
- [
- コンポーネント] セクションで次の設定を行います。
- [オプション コンポーネント] で、クラスタにインストールする Solr や、他のオプション コンポーネントを選択します。
- [コンポーネント ゲートウェイ] で [コンポーネント ゲートウェイを有効にする] を選択します(コンポーネント ゲートウェイの URL を表示してアクセスするをご覧ください)。