Vision AI
AutoML Vision ではクラウドやエッジにある画像から有用な情報を引き出し、事前トレーニング済みの Vision API モデルを使用して感情の検知、テキストの理解などを行います。

Fortune 500 にもランクされる世界的な電力会社である AES は、ドローンと AutoML Vision を使用して、将来に向けたより安全で環境に優しいエネルギーへの取り組みを推進しています。

業界トップクラスの精度を誇る画像理解
Google Cloud では、業界トップクラスの予測精度で画像理解をサポートする、機械学習を活用した次の 2 つのコンピュータ ビジョン プロダクトを提供しています。
AutoML Vision
独自のカスタム機械学習モデルのトレーニングを自動化します。画像をアップロードするだけで、AutoML Vision の使いやすいグラフィカル インターフェースでカスタム画像モデルをトレーニングできます。モデルの精度、レイテンシ、サイズを最適化し、クラウド内のアプリケーションやエッジのさまざまなデバイスにエクスポート可能です。
Vision API
Google Cloud の Vision API は REST API や RPC API を介して強力な事前トレーニング済み機械学習モデルを提供します。画像にラベルを割り当てることで、事前定義済みの数百万のカテゴリに画像を高速に分類できます。オブジェクトや顔を検出し、印刷テキストや手書き文字を読み取り、有用なメタデータを画像カタログに作成します。
利点

オブジェクトの自動検出
画像内の複数のオブジェクトを、各オブジェクトの位置を含めて検出し、分類します。Vision API と AutoML Vision によるオブジェクト検出の詳細をご覧ください。

エッジでインテリジェンスを得る
AutoML Vision Edge を利用すると、高速で高精度なモデルを構築してデプロイし、画像の分類、オブジェクトの検出をエッジで行い、さらにローカルデータに基づいたリアルタイム アクションの起動を行うことができます。AutoML Vision Edge は、リソースが制約されレイテンシが重要となるさまざまなエッジデバイスに対応します。 詳細

購入行動の支援
Vision API の Vision Product Search を利用すると、小売業者は、お客様が商品画像をアップロードし、それに類似した商品のリストをすぐに確認できる、魅力的なモバイル エクスペリエンスを創り出せます。

テキストを理解して対処
Vision API は画像に含まれるテキストの検出に OCR を応用し、50 以上の言語とさまざまなファイル形式に対応します。何百万件ものドキュメントを高速で処理し、業務ワークフローを自動化する Document Understanding AI の一部にもなっています。

Data Labeling Service を利用
ラベル付けがまだ行われていない AutoML Vision 用の画像がある場合、高品質のトレーニング データが得られるように、Google チームが画像、動画、テキストへのアノテーション付けをお手伝いします。詳細
最適な Vision プロダクトを選ぶ
Vision API と AutoML Vision のいずれかを使用して処理することも、両方を使用してそのメリットを得ることもできます。Vision API は事前定義された何千ものラベルを使用してコンテンツをすばやく分類し、AutoML Vision は特定のニーズに合わせて追加のカスタムラベルを作成できます。
AutoML Vision | Vision API | |
---|---|---|
ユーザー インターフェース | ||
API の使用
REST API と RPC API を使用します。
|
|
|
グラフィカル UI の使用
グラフィカル ユーザー インターフェースを使用します。
|
|
|
事前定義またはカスタムのラベル付け | ||
事前定義されたラベルを使用した画像の分類
事前トレーニング済みのモデルが、事前定義済みラベルからなる膨大なライブラリを活用します。
|
|
|
カスタムラベルを使用した画像の分類
選択したラベルで画像を分類するようにモデルをトレーニングします。
|
|
|
Google の Data Labeling Service の利用
Google チームが画像、動画、テキストへのアノテーション付けをサポートします。
|
|
|
エッジでのデプロイ | ||
機械学習モデルをエッジにデプロイ
エッジデバイスに最適化された、低レイテンシ、高精度のモデルをデプロイします。
|
|
ML Kit との統合 |
その他の機能 | ||
オブジェクトの検出
オブジェクトをその場所と数を含めて検出します。
|
|
|
Vision Product Search の有効化
プロダクト カタログ内の写真と画像を比較し、類似する項目をランク付けしたリストを返します。
|
|
|
印刷テキストと手書き文字の検出
OCR を使用し、言語を自動的に識別します。
|
|
|
顔の検出
顔と表情属性を検出します。(顔認識はサポートされていません)。
|
|
|
著名な場所と製品ロゴの識別
|
|
|
一般的な画像属性の割り当て
|
|
|
ウェブ エンティティとページの検出
ニュース イベント、ロゴ、ウェブ上の類似画像を見つけます。
|
|
|
コンテンツの管理
画像に含まれるアダルト コンテンツや暴力的コンテンツなどの不適切なコンテンツを検出します。
|
|
|
Celebrity Recognition
画像に含まれる有名人の顔を特定します(アクセス制限あり、ドキュメントをご覧ください)。
|
|
Vision API の導入事例


AutoML Vision の導入事例




Google Cloud Next '19 のハイライト
お客様企業が Google Cloud AI をどのように使って画像データから価値ある情報を入手しているかを見てみましょう。
ユースケース
製造検査
AutoML Vision Edge を利用してエッジデバイスで不具合を特定できるようにすることで、製造の品質管理プロセスを自動化できます。
登録して Google の製造検査ソリューションの詳細をご覧ください。
Vision Product Search
Vision API を使用して、画像内の商品を検出し、商品カタログを視覚的に検索できます。
ドキュメントの分類
ドキュメントの分類、抽出、拡充に Vision API と Natural Language API を使用することで、効率的に情報にアクセスできるようになります。詳細については、 Document AI をご覧ください。
料金
リソース
コースとハンズオンラボを受講する

使ってみる
コンピュータ ビジョンをアプリケーションに統合
AutoML Vision、AutoML Vision Edge、Vision API、Vision Product Search をぜひお試しください。
このページで紹介しているプロダクトや機能にはベータ版のものがあります。プロダクトのリリース段階の詳細については、こちらをご覧ください。
Cloud AI プロダクトはこちらに記載されている各種 SLA ポリシーに準拠しています。このような SLA ポリシーで保証されているレイテンシや可用性は、他の Google Cloud サービスと異なる場合があります。