コンテンツに移動
デベロッパー

Agent Factory のハイライト: Gemini 3 で AI 従業員を構築

2026年2月16日
https://storage.googleapis.com/gweb-cloudblog-publish/images/build-anything-gemini-3-antigravity.max-2500x2500.png
Smitha Kolan

Senior Developer Relations

※この投稿は米国時間 2026 年 2 月 6 日に、Google Cloud blog に投稿されたものの抄訳です。

Agent Factory の今回のエピソードは、Smitha Kolan と Vlad Kolesnikov が、フルスタック エンジニアの Brandon Hancock を迎えてお送りします。Brandon は、8 万人以上のデベロッパーに AI のコンセプトを教えている YouTube チャンネル AI with Brandon のクリエイターでもあります。

今回の収録は、新しいフラッグシップ モデルの Gemini 3、コーディング環境 AntigravityGemini CLI のアップデートなど、Google がいくつかの重要な最新情報を発表した数時間後という特別なタイミングで行われました。このエピソードでは、ライブデモを通じてこれらの新しいツールについて詳しく説明しています。

Video Thumbnail

Gemini 3 と Gemini CLI

Gemini 3 は、Google の最新のフラッグシップ モデルです。高度な推論と複雑なエージェント運用を目的に設計されており、オーケストレーションに最適です。Gemini CLI は、ターミナルから Gemini モデルと直接やり取りできるコマンドライン インターフェースであり、デベロッパー向けの機能です。入力と出力のパイプ処理をサポートしているため、複雑なインフラストラクチャなしで、プロンプトを連鎖して軽量な「AI 従業員」を構築できる強力なツールです。

Gemini 3 Pro で個人ポートフォリオを構築する

タイムスタンプ: 01:18

Smitha は、Google AI StudioGemini 3 Pro を使用して、わずか数分でゼロから個人用ウェブサイトを構築するデモを披露しました。この目的は、LinkedIn プロフィールを変換してポートフォリオ サイトにデプロイすることでした。

  • 入力データ: LinkedIn プロフィールの PDF エクスポートと個人の顔写真のほかに、Nano Banana(画像生成ツール)で生成したインスピレーション画像をアップロードしました。

  • マルチモーダル プロンプト: コンテンツに PDF を使用することと、Nano Banana の画像をスタイルの指針にするように Gemini 3 に指示しました。

  • 反復的な改良: 最初の出力にプレースホルダ画像が含まれていたため、Smitha は AI Studio のアノテーション機能を使用して該当箇所をハイライトし、アップロードした写真を使用して修正するように Gemini に指示しました。

  • デプロイ: 最終結果は、ワンクリックで Cloud Run に直接デプロイされました。

Gemini CLI で「AI 従業員」を作成する

タイムスタンプ: 07:54

Brandon は、Gemini CLI を使用して「AI 従業員」を構築する方法を紹介しました。デモでは、潜在顧客を見つけるために設計された市場調査エージェントに焦点を当てています。このエージェントは、Brandon が関わる救急医療サービス分野のスタートアップを対象にしたものです。

  • 標準作業手順書(SOP): Brandon は、プロンプトをマークダウン ファイルに保存された SOP として扱っています。Gemini 3 Pro を使用して大まかな指示を書き、より高速で安価な Gemini 2.5 Flash を使用して「働き蜂(作業担当者)」のタスクを実行しました。

  • 並列実行: Gemini CLI を呼び出して複数のエージェントを並列実行する Python スクリプトを実演しました。これにより、潜在顧客を複数の都市(例: マイアミ)で同時に検索することが可能になりました。

  • 裏技: Brandon は、Python スクリプトを Gemini に渡すことで、モデルがパラメータを理解し、ワークフロー自体を開始できる仕組みを説明し、自動化を効果的に自動化できることを紹介しました。

「Anya the Capybara」動画エージェント

タイムスタンプ: 18:15

Vlad は、Agent Development Kit(ADK)で構築したエージェントを実演しました。このエージェントは、技術ドキュメントを魅力的な教育動画に変換するもので、AI キャラクターの「Anya the Capybara」がナビゲートします。

  • エージェント アーキテクチャ: このシステムは、2 つのサブエージェントを管理するルート オーケストレーター エージェントを使用しています。これらのサブエージェントは、スクリプト シーケンサー(技術的なテキストを自然なスクリプトに変換し、8 秒単位のセグメントに分割する)と動画生成ツールです。

  • 一貫性: キャラクターの一貫性を保つため、Vlad は Nano Banana を使用して Capybara の 4 つの特定のビューを生成しました。エージェントはチャンクごとにランダムにビューを選択し、動画をダイナミックに保ちます。

  • Antigravity の活用: Vlad は、新しい Antigravity の機能を使用してエージェントのコードをリファクタリングしたことを明らかにしています。プロンプトとサブエージェントの変更を Antigravity に指示するだけで、コーディング作業がツールで自動的に処理されました。

  • 動画の結合: 最後に、Gemini CLI を使用して FFmpeg コマンドを記述し、生成された 92 個の動画チャンクを 11 分間の 1 本の動画に結合しました。

動画生成エージェントのコードはこちらで確認できます。

AI ファーストの考え方

タイムスタンプ: 10:21

デモの合間には、これらのツールを構築する際の理念について話し合いました。Brandon は、AI 時代における生産性向上へのアプローチについて語りました。

AI 従業員のコンセプト

タイムスタンプ: 15:50

Brandon は、あらゆる面で「AI ファースト」を目指すという目標を説明しました。彼は、エージェントを単なるスクリプトとして考えるのではなく、自身が高度な戦略に集中できるようにしてくれる従業員と捉えており、「標準業務手順書」(マークダウン ファイル)のフォルダを作成することで、市場調査やメールの下書きなどのタスクを Gemini に割り当てることができると説明しました。また、現在は参入障壁が非常に低くなっているため、コーディングの経験がなくても、Gemini モデルの「従業員」を立ち上げて、反復作業を大規模に処理できると指摘しています。

「ゴーストライター」ワークフロー

タイムスタンプ: 15:50

Brandon は、市場調査の例のほかに Gemini CLI を「ゴーストライター」として使用する方法についても触れました。MCP(Model Context Protocol)サーバーを Gmail に接続することで、AI に過去の文体を学習させ、メールの返信の下書きを作成できることを紹介しました。重要なのは、AI がタスクを開始する前に「自分が誰であるか」を認識できるように、適切なコンテキストを提供することだと、Brandon は強調しています。

まとめ

本エピソードでは、開発サイクルが急速に進化してることを浮き彫りにしました。推論に Gemini 3 Pro、迅速な実行に Gemini CLI、コードのリファクタリングに Antigravity といったツールを使用することで、あらゆるものを自動化することが現実となる時代が到来しています。個人のウェブサイトを構築する場合でも、市場調査エージェントのフリートを構築する場合でも、アイデアから実行に至るまでの障壁はかつてないほど低くなっています。

構築してみる

Gemini CLI を使用してご自身の「AI 従業員」を構築することに挑戦してみませんか。繰り返し行っている簡単なタスクから始め、マークダウンで標準作業手順書を作成し、Gemini にそのタスクを任せられるかどうか試してみましょう。

エピソード全体をチェックして、コードが動作する様子をご覧ください。

関連情報

Google AI Studio と Gemini 3 → https://goo.gle/487Fnde

Antigravity → https://goo.gle/49z1sE9

Video Avatars Agent リポジトリ → https://goo.gle/4oP8Vnd

担当者のソーシャル メディア

- シニア デベロッパーリレーションズ Smitha Kolan

投稿先