テキスト検出

テキスト検出は、光学式文字認識（OCR）を実行して動画または動画セグメント内のフレームから可視テキストを検出し、検出されたテキスト、およびテキストのフレームレベルでの場所と動画でのタイムスタンプについての情報を返します。

テキスト検出は、番組や映画の最後のキャストリストの検出や抽出、焼き付き字幕の検出など、メディアやエンターテイメントのユースケースに特に便利です。

テキスト検出は、Cloud Vision API でサポートされている言語で実行できます。

動画または動画セグメントのテキストを検出するには、annotate メソッドを使用して、[features] フィールドに TEXT_DETECTION を指定します。

Video Intelligence API ビジュアライザをご覧いただき、この機能の動作をご確認ください。

テキスト検出のリクエストとアノテーション付きの結果を取得する例については、テキスト検出をご覧ください。