インフラ、人材、モデル: Higgsfield.ai から学ぶ生成 AI スタートアップのための 3 つの教訓
Alex Mashrabov
Founder, Higgsfield.ai
現在 2 つ目の AI スタートアップを成功へと導いている Alex Mashrabov 氏が、めまぐるしく変化する環境下で、時間、資金、リソースを効率的に活用するためのアドバイスを共有します。
※この投稿は米国時間 2024 年 8 月 9 日に、Google Cloud blog に投稿されたものの抄訳です。
米国の成人は、1 日に約 3 時間をなんらかの形でオンライン動画の視聴に費やしています。そのため、企業が独自の製品、サービス、アイデアを視聴者に認知してもらうには、オンライン動画が重要なチャネルとなることは明らかです。
とはいっても、優れた映画がそうであるように、よい動画はそう簡単に制作できるものではなく、多額の費用がかかります。アイデアを出し、撮影、編集など、費用(1 分あたり数千ドルかかることもあります)を考えると、多大な時間と投資が必要になる可能性があり、潤沢なマーケティング予算がある大企業であっても、単一案件としてはリスクの高い投資になります。中小企業にとっては、なおさら困難な投資です。
私たちは、どのような規模の企業でも魅力的なコンテンツを配信できるように、動画制作を民主化する方法が必要だと考えていました。そこで 1 年前に Higgsfield.ai 社を立ち上げたのです。
当社はマーケティング担当者をターゲットに立ち上げたスタートアップで、生成 AI を使用してわずかな費用と半分の時間で動画コンテンツを作成するための、軽量で使いやすい動画制作ツールを提供しています。また、ストーリーの主役は人間であることが多いため、人間の動きをリアルに表現する動画を生成する機能を重要視しています。
実際に自分の目で確かめてみたいと思いませんか?このたび、私達はマルチモーダル AI プラットフォームである Diffuse 2.0 をリリースしました。これを使用することで、ユーザーの写真、動画、テキストをその人の個性や創造性と組み合わせて、ユーザーが主役の楽しくて意味のあるストーリーを作成できます。これは TikTok の自己発見機能と Choices のストーリーテリング コンテンツを組み合わせたようなもので、すべて当社の基盤となる AI 動画モデルを活用しています。
私自身と AI との関わりは深く、過去には創作に特化した別のスタートアップ企業、AI Factory の共同創設者であった時代まで遡ります。同社は Snapchat で使用するフィルタやツールを開発しており、後に Snap に買収されました。このソーシャル メディア企業で AI 部門の責任者を務めた後、Higgsfield.ai を設立しました。
この経験を通じて、私は、AI を利用することがスタートアップにとって独特な課題となることに関して、いくつかの重要な教訓を得ました。AI には計り知れない可能性があり、その進化は目覚ましいものです。企業がモデルの限界を押し広げ続けて、競合他社より優位に立つためには、リソースに賢く投資する必要があります。
課題に対処し、スタートアップを成功へと導くために採用できる主要な選択肢が 3 つあります。
1. 高速で強力なインフラストラクチャ上に構築する
Snapchat での経験から、数多くのブランドが、増え続ける視聴者にリーチするために、このプラットフォームに参加するのを見てきました。しかし、Snapchat本来のモバイル体験に最適化された独自のコンテンツ制作を検討するブランドは、ごくわずかだったという現実も目の当たりにしました。
デジタル時代においてチャネルや販売経路が拡大し続けるなか、コンテンツをその媒体に合わせて最適化することは極めて重要です。Higgsfield の目指すところは、ユーザーがわずかな時間とリソースで創造性を発揮し、新しい可能性を切り開けるよう支援することです。そのためには、当社が、ユーザーが頭に思い描くあらゆるビジュアルを処理できるよう、モデルをトレーニングすることが欠かせません。また、当社のプラットフォームは、ユーザーがパーソナライズしたバリエーションを試したくなるように、高速に動画を生成する必要があります。少しでもタイムラグがあると、ユーザーはクリックして中断するか、アプリを切り替えてしまうでしょう。
AI を使用したコンテンツのトレーニングと生成の鍵となるのが、インフラストラクチャです。これまで、Google Cloud は当社の生成 AI ビジネスに最適な基盤を提供してきました。Google Cloud の数十年にわたる AI の経験と、Vertex AI や AI Hypercomputer などの専用プラットフォームにより、当社は推論のトレーニングやペタバイト規模のデータの高速処理に最適なツールを利用することができます。これにより、モデルの継続的な改善、オーケストレーション レイヤーの開発、そして実験の容易なセットアップを実現しています。
その結果、常に一段上のレベルのスタイルやパフォーマンスを目指す動画プラットフォームが誕生しました。このプラットフォームは、ユーザーがさまざまな視聴者に訴える、高度にパーソナライズされた動画を制作できるよう支援します。例えば、カフェのテラスでコーヒーを楽しむ若い女性だけでなく、年配の男性や宇宙飛行士が、夜にバーや宇宙ステーションでコーヒーを味わうシーンも簡単に生成できます。適切なインフラストラクチャがあれば、ユーザーは自身の創造性を活かし、あらゆるアイデアを迅速に形にすることができます。
2. 有能なパートナーのサポートを活用する
AI 市場は急速に変化しており、Higgsfield.ai も同様です。当社の素晴らしいチームは、よりリアルな顔や表情、ダイナミックなカメラの動きや照明、あらゆる種類のプロンプトに対応できるビジュアルなど、動画モデルをよりリアルにするために日々尽力しています。
信頼できるクラウドプロバイダーとの連携は、チームがスケールアップするために必要なサポートを得て、AI を迅速に改善する開発に集中できる環境を提供します。エンジニアリングの面倒な作業の約 90% が、デバッグ、エラーの修正、例外のキャッチであることは周知の事実です。Google Cloud のような信頼性の高いクラウド プロバイダを利用することで、コアビジネスに集中して取り組む時間を増やせます。現在、当社のモデルは常に改善されており、マーケティング担当者が思い描くあらゆる動画を提供できる未来へと近づいています。
カフェにいる女性でも、宇宙ステーションにいる宇宙飛行士でも、Higgsfield の AI 動画テクノロジーを使用すれば、迅速かつシームレスにデザインを変更できるので、動画コンテンツを作成しやすくなります。
もう一つの重要な要素は、クラウド プロバイダから得られるサポートの質です。スタートアップである当社は特に、インフラストラクチャを構成、維持するためにトレーニングと使いやすいツールセットを頼りにしています。Google for Startups プログラムの一環として、クラウドをさらに活用して迅速にスケールアップするのに役立つ、追加のトレーニングとツールセットのクレジットを受け取りました。専門家のアドバイスと実戦でテストされたツールを活用することで、自信を持って開発を進めることができます。
3. 利用可能なモデルから最適なモデルを選ぶ
生成 AI の分野では、新しいモデルが日々改良されています。スタートアップは、時間、資金、人材といったリソースに限りがあります。
すべての要素を自社で開発する必要はありません。業界の優秀な人材によって構築された、利用可能なツールを活用しましょう。また、社内で開発するのが最適なビジネス要素と、既存の生成 AI ツールでカバーできる要素を特定しましょう。
当社の場合、私たちは「人間らしさ」を表現する動画、つまり、喜び、踊り、音楽を奏で、笑い、涙する人間の姿を映し出すことに焦点を当てています。動画のその他の側面については、可能な限り既存の生成 AI ツールを活用しています。
リソースを賢く使い、すべてをゼロから構築する必要があると思わないでください。業界の優秀な人材によって構築された、利用可能なツールを活用しましょう
例えば、Gemini は動画理解の領域を超え、動画生成をより精密に制御することを可能にします。また、動画字幕作成などにも適しており、非常に正確な字幕を提供して、競合他社よりも 50% 優れたマッチングを実現します。これにより、マーケティング担当者はソーシャル メディア動画をより幅広いオーディエンスにアピールできます。
生成 AI は日々進化しています。当社は、ソーシャル動画において誰もが生成 AI を活用できるようになることを楽しみにしています。お客様やマーケティング パートナーのためにこれを実現するには、AI スタートアップにも公平な機会を提供できるようにする、Google Cloud のような AI パートナーが必要です。
AI ビジネスを立ち上げるには、継続的な研究、テスト、改善に向けて精力的に取り組む必要があります。常に次のレベルのパフォーマンスを目指す必要があります。AI Factory、Snap、Higgsfield.ai での経験を通じて、スタートアップの成功には適切なインフラストラクチャ、ツール、パートナーがいかに重要であるかを目の当たりにしてきました。他社がすでに解決済みの課題にリソースを割くのではなく、自社独自のビジネスに集中することが重要です。
すべてを自力で成し遂げようとすれば、それだけ負担とリスクが増大します。パートナーと連携すれば、より大きな成果を達成できるのです。
-Higgsfield.ai、創設者 Alex Mashrabov 氏