開発環境

機械学習ソリューションの一連のテクノロジーとして AI Platform を使用するには、前提条件と依存関係を慎重に考慮した開発環境を用意する必要があります。このページでは、開発環境を作り上げる要素と、それに付随する問題を説明します。

Python バージョンのサポート

デフォルトでは、AI Platform は Python 2.7 を実行します。

Python 3.5 は、AI Platform のランタイム バージョン 1.4 以上で使用できます。トレーニング ジョブの Python バージョンは、構成ファイルまたは gcloud コマンドで設定します。

Python 2 または Python 3 でトレーニングを行ったかどうかにかかわらず、オンライン予測とバッチ予測はトレーニングされたモデルで動作します。

Python 2 と Python 3 の間でコードの移植が必要な場合は、six などの互換性のあるライブラリを使用します。デフォルトでは、AI Platform のランタイム イメージに six が含まれています。

ルートアクセス権

基本開発環境を構成している場合は、sudo を使用して、macOS または Linux で pip インストールを実行する必要があります。ただし、仮想環境を使用する場合は、インストールは OS に保護されたシステム ディレクトリの外で行われるため、root にアクセスする必要はありません。

ランタイム環境

クラウドで GCP プロジェクトを実行する仮想マシンの構成は、使用するランタイム バージョンによって定義されます。

Python 仮想環境

特に同じコンピュータ上で異なるテクノロジーを使用する他の Python アプリケーションを開発する場合に、Python の構成が複雑になることがあります。仮想環境を使って Python 開発を行うことで、パッケージとバージョンの管理を簡素化できます。

Python 仮想環境はインタープリタとパッケージを管理し、それらは、使用するコンピュータのデフォルト環境から切り離されてプロジェクト専用となります。仮想環境を使用し、作業用のそれぞれの Python プロジェクトのために別々の環境を構成できます。その際には、必要に応じて Python の独自のバージョンやモジュールを含めます。

仮想 Python 環境にはいくつかのオプションがあります。Anaconda(または、その最小構成版である Miniconda)をおすすめします。これらには、Conda と名付けられた、独自の仮想環境マネージャが含まれています。Anaconda は、データ サイエンティストがよく使用する人気の高いパッケージとツールのスイートです。

機械学習のフレームワーク

AI Platform は以下のフレームワークをサポートしています。

Google Cloud Platform アカウント

AI Platform のクラウド機能を使用するには、GCP アカウントで課金を有効にし、プロジェクトで AI Platform のトレーニング API と予測 API を有効にする必要があります。GCP を初めて使用する場合は、プロジェクトの概要で詳細をご覧ください。

Cloud Compute リージョン

処理リソースは、リージョンとゾーンによって割り当てられます。これは、リソースが物理的に設置されたデータセンターに相当します。通常は、モデルのトレーニングなどの一回限りのジョブは、自分の物理的ロケーション(または対象ユーザーの物理的ロケーション)に最も近いリージョンで実行するべきです。ただし以下の点に注意してください。

  • GPU や他のハードウェアでのモデル トレーニング、オンライン / バッチ予測など、AI Platform サービスで利用可能なリージョン

  • AI Platform のジョブは、ジョブのデータの読み書きに使用している Google Cloud Storage バケットと同じリージョンで実行する必要があります。

  • AI Platform のジョブデータの読み書きに使用する Google Cloud Storage バケットには、Regional Storage タイプを選択する必要があります。

次のステップ

このページは役立ちましたか?評価をお願いいたします。

フィードバックを送信...

scikit-learn と XGBoost の AI Platform