コンテンツに移動
AI & 機械学習

新たな領域を切り拓く: Video Intelligence API と生成 AI を使用した音声文字起こしの相乗効果

2024年2月29日
Google Cloud Japan Team

※この投稿は米国時間 2024 年 2 月 21 日に、Google Cloud blog に投稿されたものの抄訳です。

動画分析と生成 AI が産業にもたらす可能性は計り知れないものがあります。これらのテクノロジーは、自動インサイト、意思決定、コンテンツ生成において新たな領域を切り開いています。AI による情報分析と音声データを組み合わせることにより、組織は販売や収益の増加からカスタマー エクスペリエンスの向上、費用の削減まで、ビジネス全般にわたるメリットを実現しています。これらのツールを検討していない組織は、競合他社に遅れをとるリスクがあります。

この投稿では、ビジュアル インテリジェンスと言語インテリジェンスの組み合わせによる途方もない可能性についてご紹介します。動画分析と AI を活用することで、革新的な分析情報を引き出し、まったく新しい購入者体験を創出し、お客様との関係を向上させる方法を明らかにします。その可能性は想像の限り広がります。今こそ、検討を始めるときです。

今日のデジタル時代では、高度な動画分析とコンテンツ生成に対する需要が急激に増加しています。実際、Precedence Reserch と Straits Research の調査によると、動画分析産業は 2032 年までに 507 億ドルに達する見込みで、生成 AI 産業は 2032 年までに 1,180 億 6,000 万ドルに達すると予想されています。組織が動画内の音声文字起こしから分析情報を抽出し、自動化によってプロセスを合理化する AI ソリューションを模索していることは明らかです。

動画コンテンツを大規模に分析し、大規模言語モデルを活用してコンテキストに基づく説明を生成する能力を組み合わせることで、以下のようなまったく新しい可能性を手に入れることができます。

スポーツ分析: 生成 AI を活用して試合後のインタビューをブログ記事に変換します。これらのインサイトにより、コーチはトレーニングを最適化し、より効果的に戦略を練り、スターの才能を発掘できます。

不動産販売: 物件を内覧する動画をコンピュータ ビジョンで分析し、間取り、状態、設備に関する重要な詳細を抽出します。文字起こしを生成モデルにフィードすることで、物件の詳細な説明を簡単に構築します。その後、AI が分析を行い、類似物件と比較して、市場価値を正確に見積もります。

小売: 料理番組の文字起こしからリアルタイムで材料を抽出します。シェフがレシピを説明すると、それに合った商品が自動的にカートに入ります。自宅での調理を楽しみたい人たちのために合理化されたショッピング エクスペリエンスを提供します。

Google Cloud の Video Intelligence APIGoogle Cloud の生成 AI は、無料の動画分析とコンテンツ作成機能を提供しています。Video Intelligence API により、企業はラベル付け、音声文字変換、ショット検出などの機能を使用して、大規模で効率的な動画コンテンツの分析が可能になります。一方、生成 AI は、テキスト、画像、音声、動画の自動生成と要約を実現します。これらのテクノロジーを組み合わせることで、包括的なソリューションを提供できます。Video Intelligence API が動画アセットから重要な分析情報を抽出する一方で、生成 AI がこれらの分析情報を活用してチャットボット、物件、記事などの斬新な体験を創出します。この分析からコンテンツ作成までのエンドツーエンドのパイプラインにより、とてつもない価値がもたらされます。

相乗効果を探索する

不動産会社が Video Intelligence API を使用して、営業社員が作成した内見動画を分析するとしましょう。まず、API は内見動画を分析し、物件の特徴や状態を特定します。その後、各物件のカスタムリストの説明を生成する生成モデルに文字起こしがフィードされます。高度な動画分析と AI が生成したコピーを組み合わせることで、物件は間取りや設備などの視覚的な詳細や、各物件のカスタマイズされた説明テキストを含む、豊富な詳細情報でインデックス登録できます。その結果、不動産検索プラットフォームに表示されやすくなり、潜在的な購入者により良い利用体験を提供できます。

生成 AI と組み合わせた動画分析の応用の可能性は、不動産物件にとどまりません。この強力な組み合わせは、さまざまな分野に価値をもたらします。

  1. パーソナライズされた住宅検索: マルチモーダル分析を活用して、購入希望者の住宅検索をパーソナライズします。Google の基盤モデルを活用することで、購入者の特定の条件に一致する住宅の説明文を生成できます。パーソナライズされたされたこれらの説明は、購入者の好みに沿う、カスタマイズされた住宅リストをキュレートし、検索エクスペリエンスを大幅に向上させます。
  2. 生成 AI を活用した検索: 動画分析とGoogle Cloud の音声モデルである Chirp を活用することで、物件の内見動画を自動的に文字起こしできます。この音声文字変換により、お客様は動画内の特定の特徴や詳細を検索しやすくなります。たとえば、「堅木張りの床」や「御影石のカウンタートップ」が使用されている住宅を検索すると、これらの特徴について言及された動画をすぐに見つけることができます。そのため、より効率的かつ効果的に物件を探せるようになります。
  3. お客様の分析情報: Video Intelligence API と生成 AI を組み合わせることにより、組織はお客様の内見に関するフィードバックを分析できます。このフィードバックから分析情報を抽出することで、お客様の好き嫌いや優先傾向をより深く理解できるようになります。この貴重な情報は、マーケティングや営業活動のパーソナライズ、カスタマー エクスペリエンスの最適化、さらには現物を内見できないお客様のためのバーチャル リアリティのルームツアーの向上に利用できます。
  4. 動画の要約に基づいた物件の特徴に関する質問と答え(QnA): Video Intelligence API では、内見動画から物件の主な特徴を要約できます。この生成 AI による要約を質問応答機能と統合することで、インタラクティブな QnA システムを作成できます。購入希望者は、物件の特徴や状態などについて質問でき、システムは動画の要約に基づいて正確で有益な回答を返します。これにより、関連情報に即座にアクセスできるようになり、意思決定プロセスが合理化されるため、カスタマー エクスペリエンスが向上します。
https://storage.googleapis.com/gweb-cloudblog-publish/original_images/demo_.gif

Video Intelligence API と生成 AI の組み合わせは無限の可能性をもたらし、その分析力とクリエイティブな力が相まって、さまざまな分野のイノベーションへの道を切り開きます。不動産会社では、この融合により次のような目に見えるメリットがもたらされます。

  1. 売り上げの増加: 手作業のタスクから解放され、お客様との関係構築や取引の成立により多くの時間をかけることができます。
  2. カスタマー エクスペリエンスの向上: 高い可用性により、各クライアントに合わせてパーソナライズされたガイダンスを提供できます。
  3. 費用の節約: 定型タスクを自動化することで、経費と人件費を削減できます。

アーキテクチャ:

https://storage.googleapis.com/gweb-cloudblog-publish/images/Architetcure.max-1700x1700.png

このデモに使用したサンプル動画はこちらからご覧いただけます。

ビジュアル インテリジェンスと言語インテリジェンスの融合により、さまざまな業界での顧客エンゲージメントに変革がもたらされ、分析情報の入手とコンテキスト化されたコンテンツの作成のための革新的な方法が引き出されます。繰り返し作業を自動化することで、従業員はお客様と永続的な絆を築くきめ細かなサービスを提供できるようになります。フィルタ、内見、検索を分析し、好み、ニーズ、さらには言葉にしていない願望も明らかにするこれらのテクノロジーは、人の行動を鮮明に描き出します。動画や文字起こしがカスタマー ジャーニーの曖昧なストーリーを明らかにし、各タッチポイントを最適化する機会が無限に生まれます。最終的に、この AI 機能の相乗効果は企業とそのお客様にとって、より有意義な個人的つながり、より詳細な分析情報、充実した体験をもたらすでしょう。

関連資料:

Google Cloud の生成 AI によって組織がどのように向上できるかをご確認ください

-データと分析、生成 AI スペシャリスト Layolin Jesudhass

-データと分析、生成 AI スペシャリスト Sagar Kewalramani

投稿先