使用 Google Cloud AI 技術輔助圖像產生功能,搭配採用 Python、Java、Go 等程式設計語言的 API,即可在數秒內根據文字敘述生成圖像。
新客戶可獲得價值高達 $300 美元的免費抵免額,盡情使用 Vertex AI 的 Imagen 生成圖像等內容。
總覽
文字轉圖像 AI 可用於應用程式開發,專門生成模擬圖、原型、插圖、測試資料、教育內容和偵錯結果圖表。Google Cloud 的 Vertex AI 和 Cloud Vision API 為開發人員提供一系列圖像處理功能,包括文字偵測、物件偵測和圖像分類功能。Document AI 可從掃描的文件中擷取文字敘述,然後根據敘述生成圖像。
Imagen 是具深度語言理解能力的擴散模型,適合生成擬真圖像。Parti 是自動迴歸模型,適合生成統一風格和主題,以及特定風格的圖像。Muse 是 Transformer 模型,可生成包含多個物件和複雜結構的圖像。每種模型各有優點:Imagen 擅長生成逼真圖像,Parti 的圖像內容豐富,Muse 提供編輯工具且速度飛快。這些模型都很容易上手,不需要程式設計知識即可使用。
Imagen 3 是 Google 最新的圖像生成模型。相較於 Imagen 2,這項產品提供出色的影像品質,外加多項改善,包括加快超過 40% 的生成速度,方便快速執行原型設計及疊代;更確實理解提示並遵循指令;寫實生成內容,包括人群;以及進一步控制圖片中的文字轉譯。
Imagen 3 推出預先發布版,讓 Vertex AI 客戶搶先體驗,並提供多語言支援、內建安全防護功能 (例如 Google DeepMind 的 SynthID 數位浮水印),以及多種顯示比例支援。
您可以透過 Google Cloud 的 Vertex AI 或第三方 API 供應商,存取得這些文字轉圖像 AI 模型。只要向模型提供文字提示並選取參數,最後生成圖像即可。部分模型可讓使用者選取參數,來控制生成圖像的風格、創意和準確率。
運作方式
文字轉圖像 AI 會使用自然語言處理 (NLP) 技術,將文字敘述轉換成機器可讀的格式,隨後以龐大的文字和圖像資料集,訓練機器學習模型學習辨識模式,並運用這些模式生成新的圖像。Google Cloud 的文字轉圖像 AI 採用名為 Imagen 的先進深度學習模型,能根據文字敘述,生成逼真的圖像。
常見用途
Imagen 可用來編輯現有或生成的圖像。您可以輸入文字提示來更新整張圖像 (無遮蓋編輯),也可以在輸入圖像更新的文字說明時,另外指定要修改的部分 (遮蓋型編輯)。
Imagen 可用來編輯現有或生成的圖像。您可以輸入文字提示來更新整張圖像 (無遮蓋編輯),也可以在輸入圖像更新的文字說明時,另外指定要修改的部分 (遮蓋型編輯)。