可用的 Gemini 模型

Gemini 系列模型屬於多模態性質,可處理文字、圖像、音訊和影片等多種形式的資訊。Gemini 可以探索及分析大量資訊,順暢理解及處理這些多模態資料類型。詳情請參閱「Gemini 總覽」一文。

Gemini 1.5 Flash 是 Gemini 系列模型的輕量版,速度快且經濟實惠。Gemini 1.5 Pro 的設計更為強大。

本頁面說明您可以在 Google Distributed Cloud (GDC) 實體隔離環境中使用的 Gemini 模型規格。

模型應用實例

下表彙整 Gemini API 提供的模型應用實例。

型號 輸入 輸出內容 用途
Gemini 1.5 Pro 文字、程式碼、圖片、音訊、影片、含音訊的影片、文件 文字 支援需要提升回覆品質的應用程式。
Gemini 1.5 Flash 文字、程式碼、圖片、音訊、影片、含音訊的影片、文件 文字 為符合成本效益的應用程式提供速度和效率。

以下資訊詳細說明各個 Gemini 模型。

功能 Gemini 1.5 Pro Gemini 1.5 Flash
說明 適用於多模態用途的一般用途模型。需要處理大量要求並理解長篇脈絡的模型時,請使用這個模型。 這款輕量級模型速度快、成本效益高,專為多模態用途而設計。需要處理大量要求且符合成本效益的模型時,請使用這個模型。
功能
  • 文字提示
  • 多模態提示:
    • 圖片
    • 音訊
    • 影片
    • 文件
  • 文字提示
  • 多模態提示:
    • 圖片
    • 音訊
    • 影片
    • 文件
脈絡窗口 最多 32,000 個符記 最多 32,000 個符記
每個提示的圖片數上限 100 100
原始圖片大小上限 20 MB 20 MB
Base64 編碼圖片大小上限 7 MB 7 MB
每個提示的音訊檔案數量上限 不限 不限
音訊長度上限 15 分鐘 09 分鐘
每個提示的影片數上限 10 10
影片長度上限 (僅限影格) 120 秒 120 秒
影片長度上限 (影格和音訊) 100 秒 100 秒
文件檔案大小上限 50 MB 50 MB
每項要求的文件檔案數上限 100 100
每個文件的頁數上限 100 100

選擇模型並建構提示

您必須選擇要用來生成內容生成要求回應的模型。您選取的模型會影響輸出內容和費用。

GDC 中的 Gemini 模型端點 ID 如下:

名稱 模型端點 ID
Gemini Flash gemini-1.5-flash
Gemini Pro gemini-1.5-pro

接著,您必須製作提示,讓模型輸出內容。您可以提供精確的指令、範例和必要背景資訊或專業資訊,改善模型輸出內容。如要進一步瞭解提示,請參閱「提示簡介」。