このページは Cloud Translation API によって翻訳されました。

Dataproc と Apache Spark を使用した Monte Carlo メソッド

Dataproc と Apache Spark を組み合わせると、Java、Python、Scala でプログラミングされた Monte Carlo シミュレーションを実行するために使用できる、インフラストラクチャと容量を得ることができます。

Monte Carlo メソッドは、ビジネス、エンジニアリング、科学、数学、およびその他の分野の幅広い範囲の質問に答えることができます。繰り返しのランダムサンプリングを使用して変数の確率分布を作成することで、Monte Carlo シミュレーションは、他の方法では答えることが不可能な質問にも回答を提供できます。たとえば金融では、株式オプションの価格設定には、時間の経過とともに変化する可能性がある何千通りもの株式の価格を分析する必要があります。Monte Carlo メソッドは、問題への可能なインプットのドメインに対する制御を維持しつつ、これらの株価の変化を、考えられる幅広い結果にわたってシミュレートする方法を提供します。

以前は、何千ものシミュレーションを実行すると、非常に長い時間がかかり、高い費用が発生する可能性がありました。Dataproc では、オンデマンドで容量をプロビジョニングでき、分単位で支払うことできます。Apache Spark を使用すると、数十から数千のサーバーのクラスタを使用して、直感的で、かつニーズに合わせてスケーラブルな方法でシミュレーションを実行できます。これにより、より多くのシミュレーションをよりすばやく実行できるため、ビジネスのイノベーションを促進し、リスクをより適切に管理できます。

財務データを扱う場合、セキュリティは常に重要です。Dataproc は Google Cloud上で動作するため、いくつかの方法でデータの安全性、セキュリティ、プライバシーを維持するのに役立ちます。たとえば、送信時と保存時にはすべてのデータが暗号化されます。また、 Google Cloud は ISO 27001、SOC3、PCI を遵守しています。

目標

マネージド Dataproc クラスタを作成する（プレインストールされた Apache Spark を使用）。
Python を使用して、長期間にわたって株式ポートフォリオの成長を予測するための Monte Carlo シミュレーションを実行する。
Scala を使用して、カジノがどのように利益を得ているかをシミュレートする Monte Carlo シミュレーションを実行する。

費用

このドキュメントでは、課金対象である次の Google Cloudコンポーネントを使用します。

料金計算ツールを使うと、予想使用量に基づいて費用の見積もりを生成できます。

新規の Google Cloud ユーザーは無料トライアルをご利用いただける場合があります。

このドキュメントに記載されているタスクの完了後、作成したリソースを削除すると、それ以上の請求は発生しません。詳細については、クリーンアップをご覧ください。

始める前に

Google Cloud プロジェクトを設定する

Dataproc と Apache Spark を使用した Monte Carlo メソッド

目標

費用

始める前に

Dataproc クラスタを作成する

警告のロギングを無効にする

`ssh` を使用して Dataproc クラスタのプライマリノードに接続する

ロギングの設定を変更する

Spark プログラミング言語

ポートフォリオの成長を予測する

Scala での Monte Carlo シミュレーションのプログラミング

クリーンアップ

プロジェクトを削除する

次のステップ

Dataproc と Apache Spark を使用した Monte Carlo メソッド

目標

費用

始める前に

Dataproc クラスタを作成する

警告のロギングを無効にする

ssh を使用して Dataproc クラスタのプライマリ ノードに接続する

ロギングの設定を変更する

Spark プログラミング言語

ポートフォリオの成長を予測する

Scala での Monte Carlo シミュレーションのプログラミング

クリーンアップ

プロジェクトを削除する

次のステップ

`ssh` を使用して Dataproc クラスタのプライマリノードに接続する