AI & 機械学習

Google Cloud の AI が StoryCorps のアーカイブをデジタル化: 世界最大級の音声コレクション

2020年12月1日

Google Cloud Japan Team

※この投稿は米国時間 2020 年 11 月 19 日に、Google Cloud blog に投稿されたものの抄訳です。

多くの人々にとって、愛する人々と離れて過ごす今年のホリデーシーズンは、いつもと違うものになるでしょう。同じ境遇で、新型コロナウイルスの感染拡大防止に努めている皆さんに感謝を申し上げるとともに、いつもと違う方法で友人や家族とつながるために役立つかもしれないストーリーをご紹介します。

仮想的に会って話す場合、対面での直接的な会話に比べると親密さの面で到底かなわないものの、つながりを維持できますし、未来の世代のために特別な瞬間を残してくれる可能性もあります。

Google はこの精神に基づき、1 対 1 のインタビューを介して人類のストーリーの保存に専念している全国レベルの非営利組織、StoryCorps とコラボレーションしています。過去 17 年間にわたり、StoryCorps は 60 万人以上の人のストーリーを録音し、その録音をアメリカ議会図書館に送ってきました。それらは同図書館内の American Folklife Center で後世のために保存されています。

これは世界最大の音声コレクションですが、そのアクセスしやすさに難がありました。そうした中で StoryCorps は Google に対し、歴史を一人称視点で記録した豊富なアーカイブを世界中でアクセス可能で有用なものとするための支援を求めました。

StoryCorps + Google Cloud の AI

2019 年、StoryCorps と Google Cloud はパートナーシップを締結し、人工知能（AI）を利用してこの素晴らしいアーカイブの扉を開き、検索可能でアクセスしやすいオープンな音声データベースを作り上げました。これにより、誰でも人類の重要な瞬間を捉えた経験者の視点を見つけ聴くことができるようになりました。

これをどのように実現したか、詳しく説明しましょう。音声録音を検索可能にするには、音声ファイルとそのファイル内の「瞬間」またはキーワードに、検索対象の用語でタグ付けする必要がありました。

まず、Speech-to-Text API を使用して音声ファイルの文字変換を行いました。
次に、Natural Language API が、変換された文字からキーワードとその顕著性を特定しました。
変換された文字とキーワードを Elastic 検索インデックスに読み込みました。
その結果、StoryCorps アーカイブの文字検索が可能になりました。

以下は、実際の StoryCorps のインタビューを使った Cloud AI のテクノロジーによる処理のサンプルです。

https://storage.googleapis.com/gweb-cloudblog-publish/original_images/StoryCorps.gif

つながりを通じて共感と理解を深める

StoryCorps のミッションには感銘を受けます。人類のストーリーを保存するだけでなく、そうしたストーリーを可能な限り広範囲で共有することにより、「人と人の間につながりを生み出し、より公正で思いやりにあふれた世界を実現する」ことも目指しているからです。この点で、Google と StoryCorps の道筋はより深いレベルで交わっています。

AI テクノロジーに関する Google のミッションは、コンピュータサイエンス部門のトレーニングデータをはるかに超えて誰もが使えるものにすることです。この点を深く理解することで、あらゆる部門の組織が、包括性、公平性、社会的有益性を持ち、提供する製品やサービスの新たな可能性を見いだすことにつながります。

しかしこれは Google が解明していくべきストーリーであり、懸命に取り組んでいるところです。今年のホリデーシーズンに何をすることに決めたとしても、安全にお過ごしください。それまでは、ご家族で StoryCorps のプラットフォームまたはアプリを利用してつながり、ご自分のストーリーを保存し共有してはいかがでしょうか。

-Google Cloud AI および業種別ソリューション責任者 Andrew Moore

顧客事例