Cloud Vision

Google の事前トレーニングされたパワフルな API モデルを使って画像から有用な情報を抽出。AutoML Visionベータ版を使ってカスタム ビジョンモデルを簡単にトレーニングすることもできます。

無料トライアル

強力な画像分析

Cloud Vision では、Cloud Vision API と AutoML Vision が提供されています。前者を使用すると事前にトレーニングされたモデルを活用でき、後者ではユースケースに応じた柔軟なカスタムモデルを構築できます。

Cloud Vision API を使用すると、使いやすい REST API に要約した強力な機械学習モデルにより画像の内容を理解できるようになります。画像は数千ものカテゴリ(「ヨット」、「エッフェル塔」など)に高速で分類されます。また、画像に含まれる個々の物体や顔が検出され、画像内に含まれるテキストも読み取られます。さらに、画像カタログのメタデータ作成、不適切なコンテンツの管理、画像の感情分析を通じた新しいマーケティング手法の導入が可能になります。

AutoML Vision ベータ版を使用すると、機械学習の専門知識をあまり持たないデベロッパーでも、高品質なカスタムモデルをトレーニングできます。画像のアップロードとラベル付けの後に、AutoML Vision がモデルをトレーニングします。このモデルは、要求に合わせて大量のデータを処理できます。AutoML Vision は、より高いモデルの精度を提供し、本番環境用モデルの構築期間を短縮します。

強力な画像分析

画像から情報を抽出

画像内のさまざまな物体を簡単に検出して、花、動物、乗り物など、画像によく含まれている何千もの物体カテゴリに分類できます。新しいコンセプトが導入されるたびに精度が向上していくため、Vision API の性能は時がたつにつれて高まっていきます。 AutoML Vision では、画像の特定のコンセプトを強調するカスタムモデルを作成できます。これにより、商品画像の分類から病気の診断まで、さまざまなユースケースに対応できます。

画像から情報を抽出

テキストを抽出

光学式文字認識(OCR)機能により画像内のテキストを検出できます。また言語の種類も自動で判別され、さまざまな言語が幅広くサポートされています。

テキストを抽出

ウェブの力を活用

Vision API は Google の画像検索を活用し、著名人やロゴ、ニュース イベントなどの時事的なエンティティを検出します。数百万ものエンティティがサポートされているため、最新の関連画像が確実に利用できます。この機能と類似画像検索を組み合わせてウェブ上で類似している画像を検索できます。

ウェブの力を活用

コンテンツの管理

Google セーフサーチ機能を活用することで、雑多なソースの画像から適切なコンテンツだけを簡単に取り出し、不適切なコンテンツを検出できます。Vision API により、アダルト コンテンツから暴力的なコンテンツまで、さまざまなタイプの不適切なコンテンツを検出できます。

コンテンツの管理

Cloud Vision のユースケース

画像検索

Vision API と AutoML Vision を使用して、幅広いトピックやシーン(カスタム カテゴリなど)で画像を検索可能にできます。 このソリューションの詳細をご覧ください。

画像検索

ドキュメントの分類

ドキュメントの文字起こしと分類に Vision API と Natural Language API を使用することで、情報に効率的にアクセスできます。

ドキュメントの分類

商品検索

Cloud Vision API を使用して、画像内の商品を検出し、商品カタログを視覚的に検索できます。

ビジュアル商品検索

Cloud Vision API の特長

Google のパワフルな Cloud Vision API を使って、画像から有用な情報を引き出せます。

ラベル検出
乗り物や動物など、画像に写っているさまざまなカテゴリを検出できます。
ウェブ検出
類似の画像をインターネットで検索できます。
光学式文字認識(OCR)
画像内のテキストを検出、抽出できます。数多くの言語に対応しており、言語の種類も自動で判別されます。PDF ファイル、TIFF ファイル、画像(PNG ファイルや GIF ファイルなど)をアップロードできます。サポートされているファイルの詳細については、こちらをご覧ください。
手書き入力認識ベータ版
Vision API を使用すると、印刷テキストだけでなく手書き入力も認識できます。
ロゴ検出
画像に含まれる一般的な商品ロゴを検出できます。
Object Localizerベータ版
Vision API では、画像内の物体の識別だけでなく、その物体の位置と数を確認できるようになりました。
統合された REST API
REST API 経由で Cloud Vision API にアクセスして、画像あたり 1 つ以上のアノテーション タイプをリクエストできます。リクエストで画像をアップロードすることも、Google Cloud Storage と統合することもできます。
ランドマーク検出
画像に含まれる一般的な自然のランドマークや人工建造物を検出できます。
顔検出
画像に含まれる複数の人物の顔を検出できます。感情や帽子の着用といった主要な顔の属性についても識別されます。 ただし、個人を特定する顔認識には対応していません。
コンテンツの管理
アダルト コンテンツや暴力的コンテンツなど、画像に含まれる不適切なコンテンツを検出できます。
ML Kit の統合
モバイル SDK である ML Kit と統合されています。これにより、Google の機械学習テクノロジーを、強力で使いやすいパッケージの形で Android アプリと iOS アプリに簡単に適用できます。
商品検索ベータ版
ウェブやモバイルの写真からカタログに記載されている商品を認識できます。また、アプリが画像内にある商品を認識できるようにするビジュアル検索機能を実装します。
画像の属性
画像のドミナント カラーや切り抜きのヒントなど、画像の一般的な属性を検出できます。

AutoML Visionベータ版の仕組み

AutoML Vision の仕組み

AutoML Visionベータ版の特長

AutoML Vision により高品質なカスタム ビジョンモデルを容易にトレーニングできます。

カスタムモデル
最小限の労力と機械学習の専門知識で、カスタム画像分類機械学習モデルをトレーニングできます。
最先端のパフォーマンス
AutoML モデルの予測精度は、ImageNet などのベンチマークで、業界トップの評価を得ています。
ヒューマン ラベリングとの統合
お客様側で画像はお持ちでも、まだそのラベル付けがされていない場合は、Google からチームを派遣し、お客様固有の指示に従って画像を分類できます。Google は自社プロダクトで得られるレベルと同じ品質とスループットでトレーニング データを用意します。その間、お客様のデータが公開されることはありません。ヒューマン ラベリングが行われたデータをシームレスに使用して、カスタムモデルをトレーニングできます。
Google の AutoML と転移学習がサポート
Google の最先端の AutoML および転移学習テクノロジーを活用して、高品質モデルを生成できます。
完全統合
Cloud AutoML はその中核部分で他の Google Cloud サービスと完全に統合されているため、Google Cloud サービスライン全体にわたり、一貫した方法でアクセスできます。トレーニング データは Google Cloud Storage に保存されます。トレーニング対象のモデルに関する予測は、AutoML REST API に対してクエリを実行するだけで生成されます。

Cloud Vision API の料金

詳細な料金情報については、料金ガイドをご覧ください。

  1,000 ユニットごとの料金(月あたり)
機能 1~1,000 ユニット/月 1,001~5,000,000 ユニット/月 5,000,001~20,000,000 ユニット/月
ラベル検出 無料 $1.50 $1.00
テキスト検出 無料 $1.50 $0.60
セーフサーチ(不適切なコンテンツ)検出 無料 $1.50(ラベル検出を利用している場合は無料) $0.60(ラベル検出を利用している場合は無料)
顔検出 無料 $1.50 $0.60
ランドマーク検出 無料 $1.50 $0.60
ロゴ検出 無料 $1.50 $0.60
画像プロパティ 無料 $1.50 $0.60
クロップヒント 無料 $1.50(画像プロパティを利用している場合は無料) $0.60(画像プロパティを利用している場合は無料)
ウェブ検出 無料 $3.50 Google にお問い合わせください
ドキュメント テキスト検出 無料 $1.50 $0.60
Object Localizer 無料 $2.25 $1.50

商品検索予測

1~100 ユニット/日 101 ユニット以上/日
無料 お問い合わせ

商品検索保存

$0.10/1,000 個の画像

: 1 つの画像に対して顔検出とラベル検出を適用した場合、両方の機能の料金が請求されます。つまり、その月の利用ユニット数に応じた価格で、ラベル検出 1 ユニット分の料金と顔検出 1 ユニット分の料金がそれぞれ請求されます。

上限: プロジェクトで月あたり 2,000 万ユニット以上をご利用になる場合は、割引料金について営業担当者にお問い合わせください。

米ドル以外の通貨でお支払いの場合は、Cloud Platform SKU に記載されている該当通貨の料金が適用されます。

AutoML Visionベータ版の料金

AutoML Vision の料金はトレーニングと予測に基づいています。一般に、モデルの精度はトレーニングの時間数とトレーニング データセットの品質に応じて決まります。実際に使用したコンピューティング時間分しか料金はかかりません。
トレーニング
毎月 10 個のモデルまで、モデルごとの最初の 1 時間のトレーニングは無料です。これ以降の
トレーニング時間については、1 時間あたり USD $20 の料金が発生します。多くのお客様が、試験運用モデルの構築には 1 時間で十分としており、
追加的なトレーニング時間で精度を本番環境のレベルまで高めています。
予測
1~1,000 個の画像 無料
1,001~5,000,000 個の画像* $3.00/1,000 個の画像

*画像の数が 5,000,000 個を超える場合の料金については、お問い合わせください。

このページで紹介しているプロダクトや機能はベータ版です。プロダクトのリリース段階の詳細については、こちらをご覧ください。

フィードバックを送信...