借助基于 Python、Java 和 Go 编程语言的可用 API,利用 Google Cloud AI 赋能的图片生成功能,短短几秒钟内就能生成图片。
新客户可获享最高 $300 的赠金,用于在 Vertex AI 上使用 Imagen 生成图片及完成其他任务。
概览
在应用开发中,文本到图像 AI 可用于生成模型、原型、插图、测试数据、教育内容和可视化内容,以便进行调试。object detection借助 Google Cloud 的 Vertex AI 和 Cloud Vision API,开发者可以使用一整套图像处理功能,包括文本检测、对象检测和图片分类。Document AI 可用于提取扫描文档中的文本,以生成文本描述图片。
Imagen 是一种 diffusion 模型,非常适合照片写实,并且具有深层次的语言理解能力。Parti 是一种自回归模型,非常适合一致的风格和主题,以及生成特定风格的图像。Transformer 模型 Muse 可以生成具有多个物体和复杂构成的图像。每款产品都各具特色:Imagen 擅长照片写实,Parti 在内容的丰富性方面表现出色,Muse 速度快,且提供编辑工具。所有这些工具都易于使用,并且无需编程知识。
Imagen 3 是 Google 最新的图片生成模型。它提供出色的图片质量,并在 Imagen 2 的基础上进行了多项改进,包括:生成速度提高 40% 以上,实现快速原型设计和迭代;改善了提示理解和指令遵循;生成逼真的图像,包括人群;增强了对图片内文本渲染的控制。
Imagen 3 面向 Vertex AI 客户推出预览版,可抢先体验新功能,它还包含多语言支持、内置的安全功能(如 Google DeepMind 的 SynthID 数字水印),以及对多种宽高比的支持。
您可以通过 Google Cloud 上的 Vertex AI 或第三方 API 提供商访问这些文本到图像 AI 模型。如需使用这些模型,只需提供文本提示,选择参数(某些模型允许您选择参数来控制所生成图片的风格、创意和准确率),最后生成图片。
工作方式
文本到图像 AI 使用自然语言处理 (NLP) 将文本描述转换为机器可读的格式。转换为机器可读的格式后,机器学习模型即可使用大型文本和图像数据集进行训练,学习识别模式,并使用这些模式生成新的图像。Google Cloud 的文本到图像 AI 使用名为 Imagen 的深度学习模型。Imagen 是一种先进的模型,可以基于文本描述生成逼真的图像。
常见用途
使用 Imagen 修改已生成或现有的图片。您可以使用文本提示更新整个图片(无蒙版的修改),但除了更新的文本说明之外,您还可以指定修改图片的一部分(蒙版基本修改)。
使用 Imagen 修改已生成或现有的图片。您可以使用文本提示更新整个图片(无蒙版的修改),但除了更新的文本说明之外,您还可以指定修改图片的一部分(蒙版基本修改)。