Notas de la versión de IA generativa en Vertex AI

En esta página, se documentan las actualizaciones de producción de la compatibilidad con IA generativa en Vertex AI y Vertex AI Model Garden. Puedes revisar esta página de forma periódica para ver anuncios sobre características nuevas o actualizadas, correcciones de errores, problemas conocidos y funciones obsoletas.

22 de marzo de 2024

Los PDF ahora son compatibles como entrada para el modelo de lenguaje multimodal de Gemini 1.0 Pro Vision. Puedes llamar a las APIs con archivos PDF directamente o probarlo en Vertex AI Studio. Para obtener más información, consulta Envía solicitudes de instrucciones multimodales con imágenes o PDF.

19 de marzo de 2024

Los modelos Anthropic Claude 3 Sonnet y Claude 3 Haiku en Vertex AI están disponibles para el público en general en Vertex AI.

Los modelos administrados Claude 3 Haiku y Claude 3 Sonnet de Anthropic están disponibles en Vertex AI. Para usar un modelo de Claude en Vertex AI, envía una solicitud directamente al extremo de la API de Vertex AI. Para obtener más información, consulta Usa los modelos de Claude de Anthropic y las tarjetas de modelo de Claude en Model Garden:

21 de febrero de 2024

Los modelos abiertos de Gemma están disponibles.

Los modelos Gemma, una familia de modelos abiertos y ligeros compilados a partir de la misma investigación y tecnología que se usan para crear los modelos Gemini, están disponibles para ejecutarse en tu hardware, dispositivos móviles o servicios alojados. Para obtener más información, consulta Usa modelos abiertos de Gemma y la tarjeta de Model Garden de Gemma.

15 de Febrero de 2021

Modelos de Gemini 1.0 Pro y Gemini 1.0 Pro Vision de Vertex AI

Los modelos de lenguaje multimodal de Gemini 1.0 Pro y Gemini 1.0 Pro de Vertex AI tienen disponibilidad general (DG). También están disponibles en las siguientes regiones: europe-west1, europe-west2, europe-west3, europe-west4 y europe-west9.

Para obtener más información, consulta los siguientes temas:

9 de febrero de 2024

La compatibilidad con videos de incorporaciones multimodales tiene disponibilidad general

Las incorporaciones para datos de video ahora tienen disponibilidad general a través del modelo de incorporación multimodal (multimodalembedding). Para obtener más información, consulta la documentación del producto.

Esta función genera precios según el modo que uses. Para obtener más información, consulta Precios.

7 de febrero de 2024

Actualizaciones de Model Garden:

Ingeniería

Se agregaron los siguientes modelos:

  • LCM de Stable Diffusion XL: el modelo de consistencia latente (LCM) mejora la generación de texto a imagen en los modelos de difusión latente, ya que permite crear imágenes más rápido y de alta calidad con menos pasos.
  • LLaVA 1.5: implementa modelos de LLaVA 1.5.
  • PyTorch-ZipNeRF: el modelo Pytorch-ZipNeRF es una implementación de vanguardia del algoritmo ZipNeRF en el framework de Pytorch, diseñado para una reconstrucción 3D eficiente y precisa a partir de imágenes 2D.
  • LLaMA 2 (cuantizado): una versión cuantizada de los modelos Llama 2 de Meta.
  • WizardLM: WizardLM es un modelo de lenguaje grande (LLM) desarrollado por Microsoft, que se ajusta con instrucciones complejas a través de la adaptación del método Evol-Instruct.
  • WizardCoder: WizardCoder es un modelo de lenguaje grande (LLM) desarrollado por Microsoft, que se ajusta con instrucciones complejas a través de la adaptación del método Evol-Instruct al dominio del código.
  • AutoGluon: con AutoGluon, puedes entrenar y, luego, implementar modelos de aprendizaje automático y de aprendizaje profundo de alta precisión para datos tabulares.
  • LaMa (retoque de máscara grande): usa el Retoque de máscara grande con convoluciones rápidas de Fourier (FFC), una pérdida perceptiva alta de campo receptivo y máscaras de entrenamiento grandes para retoques de imágenes con resolución sólida.

Modificado

  • Se agregó un botón de ajuste con un clic y notebooks de implementación, ajuste, cuantización y evaluación dedicados para Llama 2.
  • Se agregó un botón de implementación con un clic para más de 20 modelos con artefactos de OSS previamente entrenados, incluidos Salesforce/blip-image-captioning-base y timbrooks/instruct-pix2pix.
  • CodeLlaMA70b compatible con notebooks y el botón de implementación con un clic.
  • Se agregaron notebooks de ajuste para los modelos de Mistral.
  • Se agregaron notebooks de entrega para Stable Video Diffusion Img2Vid XT (con fines de investigación).

12 de enero de 2023

El ajuste del modelo para los modelos textembedding-gecko y textembedding-gecko-multilingual está disponible en DG. Puedes usar el ajuste supervisado para ajustar el modelo textembedding-gecko. Para obtener más información, consulta Ajusta los modelos de texto.

8 de enero de 2024

AutoSxS evalúa los LLM en paralelo

La herramienta de evaluación automática en paralelo (AutoSxS) está disponible en vista previa para probar A/B el rendimiento de tus LLM o predicciones generadas con anterioridad. Es comparable con los evaluadores humanos, pero más rápido, está disponible a pedido y es más rentable.

5 de enero de 2024

Expansión regional de Generative AI on Vertex AI

Las funciones de Generative AI on Vertex AI para la predicción por lotes y la evaluación de modelos están disponibles en 12 regiones de Google Cloud adicionales.

18 de diciembre de 2023

Actualizaciones de Model Garden:

13 de diciembre de 2023

Modelos de Gemini Pro y Gemini Pro Vision de Vertex AI

Los modelos de lenguaje multimodal de Gemini Pro y Gemini Pro de Vertex AI están disponibles en Vista previa. Para obtener más información, consulta los siguientes temas:

Disponibilidad general de Imagen 2

La versión 005 del modelo de generación de imágenes (imagegeneration@005) tiene disponibilidad general para las tareas de generación de imágenes. Esta versión del modelo es la predeterminada para las tareas de generación de imágenes. Para obtener más información, consulta la documentación del producto.

Para obtener información general sobre los modelos y las versiones de Imagen, consulta Ciclo de vida y versiones de modelos de Imagen.

12 de diciembre de 2023

Modelo de incorporación de texto 003 (textembedding-gecko@003) disponible

La versión estable actualizada del modelo base de incorporación de texto, textembedding-gecko@003, está disponible. Las funciones de textembedding-gecko@003 mejoraron la calidad en comparación con las versiones estables anteriores, textembedding-gecko@001 y textembedding-gecko@002. Para obtener más información sobre las versiones de modelos, consulta Versiones y ciclos de vida de modelos.

8 de diciembre de 2023

Actualización del control de seguridad de IA generativa en Vertex AI

El control de seguridad de Transparencia de acceso (AXT) está disponible para las siguientes funciones:

  • Incorporaciones para la predicción en línea multimodal
  • Predicción en línea de Imagen en Vertex AI
  • Ajustes de Imagen en Vertex AI

6 de diciembre de 2023

Modelos de texto actualizados

La versión @002 de los modelos para texto, chat, código y chat de código están disponibles. Las versiones del modelo @002 incluyen respuestas mejoradas a los prompts. Los modelos @002 son los siguientes:

  • text-bison@002
  • chat-bison@002
  • code-bison@002
  • codechat-bison@002

Para asegurarte de usar siempre la versión de modelo estable, especifica el identificador de modelo con el número de versión. Por ejemplo, text-bison@002 Para obtener más información, consulta Versiones de modelo y ciclo de vida.

5 de diciembre de 2023

Atributo

La fundamentación de modelos está disponible en Vista previa. Usa la fundamentación para conectar los modelos text-bison y chat-bison a almacenes de datos no estructurados en Vertex AI Search. Con la fundamentación, los modelos pueden acceder a la información de los repositorios de datos y usarla para generar respuestas más mejoradas y matizadas. Para obtener más información, consulta Descripción general de la fundamentación.

1 de diciembre de 2023

Cambiar

Las siguientes actualizaciones de model_garden_name están disponibles:

30 de noviembre de 2023

Atributo

Un tamaño de modelo para PaLM 2 para texto tiene disponibilidad general (GA). El modelo text-unicorn proporciona una calidad de respuesta mejorada para un conjunto de tareas de razonamiento complejas en comparación con el modelo text-bison. Para obtener más detalles, consulta Información del modelo.

17 de noviembre de 2023

La API de ComputeToken está disponible en versión preliminar

La API de ComputeToken está disponible en (versión preliminar). Puedes usar esta API para obtener una lista de tokens para un mensaje determinado. Un token es una forma de representar una secuencia común de caracteres que se encuentran en una entrada de texto. Para obtener más información, consulta Obtén una lista de tokens.

10 de noviembre de 2023

IA generativa en Vertex AI

Los controles de seguridad están disponibles para IA Generativa adicional en las funciones de Vertex AI.

3 de noviembre de 2023

Actualizaciones de Model Garden

Atributo

Se agregaron los siguientes modelos a Model Garden:

  • ImageBind: modelo de incorporación multimodal.
  • Vicuna v1.5: LLM se ajusta según la llama2.
  • OWL-ViT v2: Modelo de detección de objetos de vocabulario abierto en SoTA.
  • DICOM: Modelo de detección de objetos de vocabulario abierto en SoTA.
  • NLLB: Modelo de traducción en varios idiomas.
  • Mistral-7B: SoTA LLM es pequeño.
  • BiGPT: LLM está ajustado para dominios biomédicos.
  • biomédico: modelo básico multimodal ajustado para el dominio biomédico.

Para ver una lista de todos los modelos disponibles, consulta Explora los modelos en Model Garden.

Modificado

  • Se mejoró la capacidad de procesamiento del modelo de lenguaje. Para obtener más información, consulta Entrega modelos de lenguaje grande de código abierto de manera eficiente en Model Garden. Los notebooks en las tarjetas de modelo relevantes se actualizaron según corresponda.
  • Velocidad de inferencia hasta 2 veces más rápida en comparación con la implementación original para los modelos estables Diffusion 1.5, 2.1 y XL
  • Se mejoró el flujo de trabajo del botón Implementar en todas las tarjetas de modelo compatibles.
  • Se actualizaron los notebooks para Llama2, OpenLlama y Falcon Instruct con especificaciones de máquina sugeridas para la entrega de modelos y los dockers de Arnés de evaluación de EleutherAI para la evaluación de modelos.

Nuevas versiones estables del modelo textembedding-gecko y textembedding-gecko-multilingual

Las siguientes versiones estables de modelos están disponibles en la IA Generativa en Vertex AI:

  • textembedding-gecko@002
  • textembedding-gecko-multilingual@001

Para obtener más información sobre las versiones de modelos, consulta Versiones y ciclos de vida de modelos.

2 de noviembre de 2023

Se puede acceder a la IA generativa en Vertex AI a través de 12 API regionales en Norteamérica, Europa y Asia. Las API regionales permiten a los clientes controlar dónde se almacenan los datos en reposo.

3 de noviembre de 2023

El ajuste de modelos para chat-bison@001 tiene disponibilidad general (DG).

El ajuste chat-bison@001 admite visualizaciones de métricas de TensorBoard. Para obtener más detalles, consulta Ajustes y métricas de evaluación.

4 de octubre de 2023

El ajuste de modelo para textembedding-gecko ahora está disponible en vista previa

Ahora puedes usar el ajuste supervisado para ajustar el modelo textembedding-gecko. Esta función está en (vista previa). Para obtener más información, consulta Ajusta los modelos de texto.

1 de septiembre de 2023

Actualización de precios

El precio de text-bison se redujo a $0.0005 por 1,000 caracteres de entrada y salida. Para obtener más información, consulta los precios de Vertex AI.

29 de agosto de 2023

Nueva compatibilidad con IA Generativa en modelos de Vertex AI y mayor compatibilidad con idiomas

Se actualizó la compatibilidad de IA generativa en Vertex AI para incluir nuevos candidatos de modelo de lenguaje (modelos más recientes), modelos de lenguajes que admiten tokens de entrada y salida de hasta 32,000 y más idiomas compatibles. Para obtener más detalles, consulta Modelos disponibles y Versiones del modelo y ciclo de vida.

Transmite respuestas de modelos de IA generativa

La compatibilidad de transmisión de modelos de IA generativa tiene disponibilidad general (GA). Después de enviar un mensaje, el modelo devuelve tokens de respuesta a medida que se generan, en lugar de esperar a que todo el resultado esté disponible.

Los modelos compatibles son los siguientes:

  • text-bison
  • chat-bison
  • code-bison
  • codechat-bison

Para obtener más información, consulta Transmite respuestas desde modelos de IA generativa.

El ajuste supervisado del modelo text-bison tiene disponibilidad general (GA)

El ajuste supervisado para el text-bisonmodelo tiene disponibilidad general (DG).

El ajuste de modelo para el modelo chat-bison ahora está disponible en vista previa

Puedes usar el ajuste supervisado para ajustar el modelo chat-bison. Esta función está en (vista previa). Para obtener más información, consulta Ajusta los modelos de texto.

Nuevo modelo de incorporación disponible en la vista previa

Los usuarios de IA generativa en Vertex AI ahora pueden crear incorporaciones a través de un nuevo modelo entrenado en una amplia gama de idiomas que no son inglés. El modelo está en (vista previa).

  • textembedding-gecko-multilingual

Para obtener más información, consulta Obtén incorporaciones de texto.

El ajuste de asunto y de estilo de imagen ahora tienen disponibilidad general (DG)

La imagen en Vertex AI ahora ofrece las siguientes funciones de DG:

  • Ajuste del modelo de asunto (ajuste estándar)*
  • Ajuste del modelo de estilo*

* Función de acceso restringido.

Para obtener más información sobre Imagen en Vertex AI o cómo obtener acceso a DG restringida, consulta la descripción general de Imagen en Vertex AI.

Ajuste de aprendizaje por refuerzo con retroalimentación humana (RLHF) para text-bison

El modelo de base de generación de texto de IA generativa en Vertex AI (text-bison) admite el ajuste de RLHF. La función de ajuste de RLHF está en (vista previa). Para obtener más información, consulta Usa el ajuste del modelo de RLHF.

Compatibilidad con el lenguaje de las APIs de Vertex AI Codey

Las APIs de Vertex AI Codey ahora admiten lenguajes de programación adicionales. Para obtener más información, consulta Lenguajes de programación admitidos.

Las APIs de Vertex AI Codey ahora admiten ajustes con supervisión

Los modelos de chat de código (codechat-bison) y generación de código (code-bison) de las APIs de Vertex AI Codey ahora admiten el ajuste supervisado. El ajuste supervisado de la función de los modelos de APIs de Vertex AI Codey se encuentra en (Vista previa). Para obtener más información, consulta Ajusta los modelos de código.

Evaluación de modelos basados en métricas

Puedes evaluar el rendimiento de los modelos de base y los modelos ajustados en comparación con un conjunto de datos de evaluación para clasificación, resumen, respuesta a preguntas y generación de texto general. Esta función está disponible en (vista previa)

Para obtener más información, consulta Evalúa el rendimiento del modelo.

API de CountToken disponible en vista previa

La API de CountToken está disponible en (versión preliminar). Puedes usar esta API para obtener el recuento de tokens y la cantidad de caracteres facturables de un prompt. Para obtener más información, consulta Obtén el recuento de tokens.

9 de agosto de 2023

Imagen con incorporaciones multimodales disponibles en DG

Imagen en Vertex AI ahora ofrece la siguiente función de DG:

  • Incorporaciones multimodales

Esta función genera precios diferentes en función de si usas entradas de imagen o de texto. Para obtener más información, consulta la página de funciones de incorporaciones multimodales.

21 de agosto de 2023

Actualización de los parámetros de ajuste de modelos

Los trabajos de ajuste de modelos aceptan parámetros opcionales para la evaluación de modelos y la integración de Vertex AI TensorBoard. Esto te permite evaluar tu modelo y generar visualizaciones con un solo comando. Para obtener más información, consulta Crea un trabajo de ajuste de modelos.

28 de julio de 2023

Actualización de los parámetros de ajuste de modelos

El parámetro learning_rate en el ajuste de modelos es learning_rate_multiplier. Para usar la tasa de aprendizaje predeterminada del modelo o de ajuste, usa el valor predeterminado learning_rate_multiplier de 1.0.

Si nunca configuraste learning_rate, no es necesario que realices ninguna acción. Si usas tuning_method=tune_v2 con la plantilla de canalización v2.0.0 (el SDK de Python v1.28.1 o una versión posterior), la tasa de aprendizaje recomendada es 0.0002. Para convertir tu learning_rate personalizado en learning_rate_multiplier, calcula lo siguiente:

learing_rate_multiplier = custom_learning_rate_value / 0.0002

18 de julio de 2023

Actualizaciones de ajuste de modelos para text-bison

  • La canalización de ajuste actualizada ahora ofrece un ajuste más eficiente y un mejor rendimiento en text-bison.
  • Nueva región de ajuste (us-central1) disponible con compatibilidad de GPU.
  • El nuevo parámetro learning_rate te permite ajustar el tamaño del paso en cada iteración.

Para obtener más información, consulta Ajusta los modelos de base de lenguaje.

DG de Chirp

Chirp tiene disponibilidad general (GA). Para obtener más detalles, consulta las siguientes páginas:

17 de julio de 2023

Imagen en las funciones de disponibilidad general de Vertex AI

Imagen en Vertex AI ahora ofrece las siguientes funciones de DG:

* Función de acceso restringido.

Para obtener más información sobre Imagen o cómo obtener acceso a las funciones restringidas de DG o vista previa, consulta la descripción general de Imagen en Vertex AI.

Compatible con la generación de rostros humanos

Imagen admite la generación de rostros humanos para las siguientes funciones:

* Función de acceso restringido.

La generación de rostros humanos está habilitada de forma predeterminada, excepto para imágenes con niños o celebridades. Para obtener más información, consulta los lineamientos de uso.

Compatibilidad adicional con idiomas

La API de PaLM de Vertex AI agregó compatibilidad con los siguientes lenguajes:

  • Español (es)
  • Korean (ko)
  • Hindi (hi)
  • Chino (zh)

Para obtener una lista completa de los idiomas compatibles, consulta Idiomas compatibles.

13 de julio de 2023

Compatibilidad Batch para PaLM 2 para Texto

La compatibilidad con las solicitudes de texto por lotes (text-bison) está disponible en (DG). Puedes revisar los precios del modelo chat-bison en la página de precios de Vertex AI.

10 de julio de 2023

PaLM 2 para Chat

La compatibilidad con Chat (chat-bison) está disponible en (DG). Puedes revisar los precios del modelo chat-bison en la página de precios de Vertex AI.

29 de junio de 2023

APIs de Vertex AI Codey

Las APIs de Vertex AI Codey tienen disponibilidad general (DG). Usa las APIs de Vertex AI Codey para crear soluciones con la generación y finalización de código, y el chat de código. Debido a que las APIs de Vertex AI Codey tienen DG, se generan costos de uso si las usas. Para obtener información sobre los precios, consulta la página de precios de IA Generativa en Vertex AI.

Los modelos de esta versión incluyen lo siguiente:

  • code-bison (generación de código)
  • codechat-bison (chat de código)
  • code-gecko (finalización de código)

La cantidad máxima de tokens para la entrada aumentó de 4,096 a 6,144 tokens para code-bison y codechat-bison, para permitir mensajes y un historial de chat más largos. Los tokens máximos de salida se aumentaron de 1,024 a 2,048 para code-bison y codechat-bison para permitir respuestas más largas.

Se admiten lenguajes de programación adicionales. Para obtener más información, consulta Lenguajes de programación admitidos.

Se quitaron varios conjuntos de datos de ajuste de los modelos code-bison y codechat-bison para implementar las siguientes mejoras:

  • Charla excesiva.
  • Artefactos, como los caracteres NBSP (espacios no rotundos).
  • Respuestas de código de baja calidad.

Para obtener información sobre los horizontales de la nube, consulta las certificaciones de Vertex AI.

15 de junio de 2023

PaLM 2 para Chat

El modelo chat-bison se actualizó para seguir mejor las instrucciones del campo context. Para obtener detalles, sobre cómo crear mensajes de chat para chat-bison, consulta Diseña mensajes de chat.

7 de junio de 2023

APIs de Embeddings y PaLM Text y Vertex AI Studio

La IA generativa en Vertex AI está disponible en (DG). Con este lanzamiento de funciones, puedes aprovechar la API de PaLM de Vertex AI para generar modelos de IA que puedes probar, ajustar e implementar en tus aplicaciones impulsadas por IA. Debido a que estas funciones tienen DG, se generan costos de uso si usas la API de PaLM text-bison y textembedding-gecko. Para obtener más información sobre los precios, consulta la página de precios de Vertex AI.

Las características y los modelos de esta versión incluyen lo siguiente:

  • PaLM 2 para Texto: text-bison
  • Embedding para texto: textembedding-gecko
  • Vertex AI Studio para lenguaje

Model Garden

Model Garden ahora está disponible en (DG). Model Garden es una plataforma que te ayuda a descubrir, probar, personalizar e implementar Vertex AI, además de elegir modelos de OSS. Estos modelos varían de los ajustes a las tareas específicas y están disponibles en la página Model Garden en la consola de Google Cloud.

Para comenzar, consulta Explora los modelos y las APIs de IA en Model Garden.

APIs de Vertex AI Codey

Las APIs de Vertex AI Codey ahora están en la (vista previa). Con las APIs de Codey, las APIs de generación y finalización de código, y de chat de código se pueden usar desde cualquier proyecto de Google Cloud sin listas de entidades permitidas. Se puede acceder a las APIs desde la región us-central1. Las APIs de Codey se pueden usar en Vertex AI Studio o de manera programática en comandos de REST.

Para comenzar, consulta la descripción general de los modelos de código.

10 de mayo de 2023

IA generativa en Vertex AI

La IA generativa en Vertex AI está disponible en (vista previa). Con este lanzamiento de funciones, puedes aprovechar la API de PaLM de Vertex AI para generar modelos de IA que puedes probar, ajustar e implementar en tus aplicaciones impulsadas por IA.

Las características y los modelos de esta versión incluyen lo siguiente:

  • PaLM 2 para Texto: text-bison
  • PaLM 2 para Chat: chat-bison
  • Embedding para texto: textembedding-gecko
  • Vertex AI Studio para lenguaje
  • Ajuste para PaLM 2
  • SDK de Vertex AI v1.25, que incluye funciones nuevas, como TextGeneratetionModel (text-bison), ChatModel (chat-bison) TextEmbeddingModel (textembedding-gecko@001)

Puedes interactuar con las funciones de IA generativas en Vertex AI a través de Vertex AI Studio en la consola de Google Cloud, la API de Vertex AI y el SDK de Vertex AI para Python.

Model Garden

Model Garden está disponible en (vista previa). Model Garden es una plataforma que te ayuda a descubrir, probar, personalizar e implementar Vertex AI y seleccionar modelos de OSS. Estos modelos varían de los ajustes a los específicos de las tareas, todos disponibles en la página de Model Garden en la consola de Google Cloud.