開発環境

機械学習ソリューションに寄与するテクノロジー セットの一部として、Cloud Machine Learning Engine には、前提条件や依存関係が慎重に構成された開発環境が必要です。このページでは、開発環境を作り上げる要素と、それに付随する問題を説明します。

Python バージョンのサポート

デフォルトでは、Cloud ML Engine は Python 2.7 を実行します。

Python 3.5 は、Cloud ML Engine ランタイム バージョン 1.4 以上で使用できます。トレーニング ジョブの Python バージョンは、構成ファイルまたは gcloud コマンドで設定します。

Python 2 または Python 3 でトレーニングを行ったかどうかにかかわらず、オンライン予測とバッチ予測はトレーニングされたモデルで動作します。

Python 2 と Python 3 の間でコードの移植が必要な場合は、six などの互換性のあるライブラリを使用します。six はデフォルトで Cloud ML Engine ランタイム イメージに含まれています。

ルートアクセス権

基本開発環境を構成している場合は、sudo を使用して、macOS または Linux で pip インストールを実行する必要があります。ただし、仮想環境を使用する場合は、インストールは OS に保護されたシステム ディレクトリの外で行われるため、root にアクセスする必要はありません。

ランタイム環境

クラウドで GCP プロジェクトを実行する仮想マシンの構成は、使用するランタイム バージョンによって定義されます。

Python 仮想環境

特に同じコンピュータ上で異なるテクノロジーを使用する他の Python アプリケーションを開発する場合に、Python の構成が複雑になることがあります。仮想環境を使って Python 開発を行うことで、パッケージとバージョンの管理を簡素化できます。

Python 仮想環境はインタープリタとパッケージを管理し、それらは、使用するコンピュータのデフォルト環境から切り離されてプロジェクト専用となります。仮想環境を使用し、作業用のそれぞれの Python プロジェクトのために別々の環境を構成できます。その際には、必要に応じて Python の独自のバージョンやモジュールを含めます。

仮想 Python 環境にはいくつかのオプションがあります。Anaconda(または、その最小構成版である Miniconda)を推奨します。これらには、Conda と名付けられた、独自の仮想環境マネージャが含まれています。Anaconda は、データ サイエンティストがよく使用する人気の高いパッケージとツールのスイートです。

機械学習のフレームワーク

Cloud ML Engine は、以下のフレームワークをサポートしています。

Google Cloud Platform アカウント

Cloud ML Engine のどのクラウド機能を使用する場合でも、課金が有効な GCP アカウントと、Cloud Machine Learning Engine API が有効なプロジェクトが必要です。GCP を初めて使用する場合は、プロジェクトの概要で詳細をご覧ください。

Cloud Compute リージョン

処理リソースは、リージョンとゾーンによって割り当てられます。これは、リソースが物理的に設置されたデータセンターに相当します。通常は、モデルのトレーニングなどの一回限りのジョブは、自分の物理的ロケーション(または対象ユーザーの物理的ロケーション)に最も近いリージョンで実行するべきです。ただし以下の点に注意してください。

  • Cloud ML Engine サービスの利用可能なリージョンに注意してください(このサービスには、GPU やその他のハードウェアでのモデル トレーニング、オンライン / バッチ予測などが含まれます)。

  • Cloud ML Engine ジョブは、そのジョブのデータの読み取り、書き込みに使用している Google Cloud Storage バケットと同じリージョンで常に実行する必要があります。

  • Cloud ML Engine ジョブのデータの読み取り、書き込みに使用する Google Cloud Storage バケットには、Regional Storage タイプを使用する必要があります。

次のステップ

このページは役立ちましたか?評価をお願いいたします。

フィードバックを送信...

scikit-learn と XGBoost の Cloud ML Engine