文字轉圖像 AI

直接使用文字生成及編輯圖像,完全不必編寫程式碼

使用 Gemini 2.5 Flash ImageImagen 圖像生成模型,搭配採用 Python、Java、Go 等程式設計語言的 API,即可在數秒內根據文字敘述生成及編輯圖像。

新客戶可獲得價值高達 $300 美元的免費抵免額,盡情在 Vertex AI 中生成圖像等內容。

總覽

什麼是文字轉圖像 AI?

文字轉圖像 AI 是一種人工智慧,可根據文字敘述生成及編輯圖片。這項技術有望改變大眾製作視覺內容及與其互動的方式。Google Cloud 在 Vertex AI 中提供多種文字轉圖像 AI 工具和資源,包括 ImagenGemini 2.5 Flash ImageVeo 等預先訓練的 AI 模型,可讓開發人員輕鬆將文字轉圖像生成技術導入應用程式。

如何將文字轉圖像用於應用程式開發作業?

文字轉圖像 AI 可用於應用程式開發,專門生成模擬圖、原型、插圖、測試資料、教育內容和偵錯結果圖表。Google Cloud 的 Vertex AI 和 Cloud Vision API 為開發人員提供一系列圖像處理功能,包括文字偵測、物件偵測和圖像分類功能。Document AI 可從掃描的文件中擷取文字敘述,然後根據敘述生成圖像。

哪些模型可用於文字轉圖像生成功能?

ImagenGemini 2.5 Flash Image 是 Google 的主要文字轉圖像模型。

這些模型有何不同?

Imagen:Imagen 是專門的純圖像模型。這款模型是擴散引擎,主要功能是根據文字提示詞生成高品質、精緻且逼真的圖像。這款模型擅長「模式比對文字轉像素」,生成精美且吸睛的輸出內容。

Gemini 2.5 Flash Image:這是原生多模態大型語言模型 (LLM)。與專門的圖像模型不同,它將圖像視為另一種「語言」。這表示 Gemini 是從頭開始訓練,能以單一整合步驟理解及處理文字和圖像。這種架構讓 Gemini 具備獨特能力,不只能生成內容。

如何使用這些 Google 模型?

您可以透過 Google Cloud 的 Vertex AIGoogle AI Studio 存取這些文字轉圖像 AI 模型。只要向模型提供文字提示並選取參數,最後生成圖像即可。部分模型可讓使用者選取參數,來控制生成圖像的風格、創意和準確率。

運作方式

文字轉圖像 AI 會使用自然語言處理 (NLP) 技術,將文字敘述轉換成機器可讀的格式,隨後以龐大的文字和圖像資料集,訓練機器學習模型學習辨識模式,並運用這些模式生成或編輯圖像。Google Cloud 的文字轉圖像 AI 採用名為 Imagen 的先進深度學習模型,能根據文字敘述,生成逼真的圖像。

生成式 AI 產品使用者介面
透過 Generative AI Studio 生成及編輯圖像

常見用途

使用 AI 生成圖像

使用文字提示來生成圖像

瞭解如何使用 Vertex AI 的 Imagen 文字轉圖像生成功能,並匯出生成圖像的高解析度版本。本快速入門導覽課程說明如何在 Google Cloud 控制台中使用 Imagen 圖像生成功能。

使用 Imagen 生成的圖片

使用文字提示來生成圖像

瞭解如何使用 Vertex AI 的 Imagen 文字轉圖像生成功能,並匯出生成圖像的高解析度版本。本快速入門導覽課程說明如何在 Google Cloud 控制台中使用 Imagen 圖像生成功能。

使用 Imagen 生成的圖片

AI 輔助編輯圖像

多圖像融合和對話式修圖

Gemini 2.5 Flash Image 可將不同圖像合併成一張全新的無縫影像內容。使用多張參考圖像,生成單一的統一圖像。此外,您也能以簡單的自然語言指令編輯圖片。無論是從團體照中移除某人,還是修正污漬等小細節,都能透過簡單的對話完成。

此外,Vertex AI 的 Imagen 還能編輯 Imagen 生成的圖片或現有圖片。您可以在輸入圖像更新的文字說明時,另外指定要修改的部分 (遮蓋型編輯)。

在 Vertex AI 中編輯圖像

多圖像融合和對話式修圖

Gemini 2.5 Flash Image 可將不同圖像合併成一張全新的無縫影像內容。使用多張參考圖像,生成單一的統一圖像。此外,您也能以簡單的自然語言指令編輯圖片。無論是從團體照中移除某人,還是修正污漬等小細節,都能透過簡單的對話完成。

此外,Vertex AI 的 Imagen 還能編輯 Imagen 生成的圖片或現有圖片。您可以在輸入圖像更新的文字說明時,另外指定要修改的部分 (遮蓋型編輯)。

在 Vertex AI 中編輯圖像

使用 AI 生成圖像說明文字

使用圖像說明生成功能產生圖像說明文字

生成圖像相關說明,包括詳細中繼資料、產品和視覺素材資源簡要說明,以及自動產生說明文字。

圖像說明生成產品使用者介面

使用圖像說明生成功能產生圖像說明文字

生成圖像相關說明,包括詳細中繼資料、產品和視覺素材資源簡要說明,以及自動產生說明文字。

圖像說明生成產品使用者介面

數位浮水印

生成及驗證圖像浮水印

Vertex AI 中某些 AI 模型 (例如 ImagenGemini 2.5 Flash Image) 生成的圖片會自動加上數位浮水印。這項技術由 Google DeepMind 開發,稱為 SynthID,可將隱形浮水印直接嵌入圖像的像素中。

如要在 Vertex AI 中偵測圖片的數位浮水印,可以使用內建的偵測工具。只要使用 Vertex AI Media Studio 上傳要驗證的圖片,如果偵測到 SynthID 浮水印,圖片就會顯示「偵測到 SynthID」徽章。

驗證浮水印圖片

    生成及驗證圖像浮水印

    Vertex AI 中某些 AI 模型 (例如 ImagenGemini 2.5 Flash Image) 生成的圖片會自動加上數位浮水印。這項技術由 Google DeepMind 開發,稱為 SynthID,可將隱形浮水印直接嵌入圖像的像素中。

    如要在 Vertex AI 中偵測圖片的數位浮水印,可以使用內建的偵測工具。只要使用 Vertex AI Media Studio 上傳要驗證的圖片,如果偵測到 SynthID 浮水印,圖片就會顯示「偵測到 SynthID」徽章。

    驗證浮水印圖片

      開始進行概念驗證

      新客戶可獲得價值高達 $300 美元的免費抵免額,盡情在 Vertex AI 中生成圖像等內容

      要執行大型專案嗎?

      瞭解可以建立的圖像類型

      瞭解如何使用文字提示生成圖像

      瞭解如何生成及確認圖片浮水印