Descripción general de la IA generativa
En este documento, se describen las funciones de inteligencia artificial (IA) generativas que admite BigQuery ML. Estos atributos te permiten realizar tareas de IA en BigQuery ML mediante modelos de Vertex AI previamente entrenados. Entre las tareas admitidas, se incluyen las siguientes:
Accede a un modelo de Vertex AI para realizar una de estas funciones mediante la creación de un modelo remoto en BigQuery ML que representa el extremo del modelo de Vertex AI. Una vez que hayas creado un modelo remoto sobre el modelo de Vertex AI que deseas usar, debes acceder a las capacidades de ese modelo mediante la ejecución de una función de BigQuery ML en el modelo remoto.
Este enfoque te permite usar las capacidades de estos modelos de Vertex AI en las consultas de SQL para analizar datos de BigQuery.
Flujo de trabajo
Puedes usar modelos remotos en modelos de Vertex AI y modelos remotos en servicios de Cloud AI junto con BigQuery. funciones de AA para realizar tareas de IA generativa y análisis de datos complejas.
En el siguiente diagrama, se muestran algunos flujos de trabajo típicos en los que puedes usar estas capacidades juntas:
Generación de texto
La generación de texto es una forma de IA generativa en la que el texto se genera en función de una instrucción o del análisis de datos. Puedes realizar la generación de texto con datos multimodales y de texto.
Estos son algunos casos de uso comunes de la generación de texto:
- Generar contenido creativo
- Generación de código.
- Generar respuestas por correo electrónico o chat
- Intercambio de ideas, como sugerir vías para productos o servicios futuros.
- Personalización del contenido, como sugerencias de productos
- Clasificar los datos aplicando una o más etiquetas al contenido para ordenarlo en categorías
- Identificar los sentimientos clave expresados en el contenido
- Resumir las ideas o impresiones clave que transmite el contenido
- Identificar una o más entidades destacadas en datos visuales o de texto
- Traducir el contenido de datos de texto o audio a otro idioma
- Generar texto que coincida con el contenido verbal en los datos de audio
- Subtítulos o preguntas y respuestas sobre datos visuales
El enriquecimiento de datos es un paso común después de la generación de texto, en el que enriqueces las conclusiones del análisis inicial combinándolas con datos adicionales. Por ejemplo, puedes analizar imágenes de artículos de decoración para el hogar para generar texto para una columna design_type
, de modo que el SKU de los artículos de decoración tenga una descripción asociada, como mid-century modern
o farmhouse
.
Modelos compatibles
Se admiten los siguientes modelos de Vertex AI:
gemini-2.0-flash-exp
(vista previa)gemini-1.5-flash
gemini-1.5-pro
gemini-1.0-pro
gemini-1.0-pro-vision
(vista previa)text-bison
text-bison-32k
text-unicorn
- Modelos de Claude de Anthropic (versión preliminar)
Para proporcionar comentarios o solicitar asistencia para los modelos en vista previa, envía un correo electrónico a bqml-feedback@google.com.
Cómo usar modelos de generación de texto
Después de crear el modelo, puedes usar la función ML.GENERATE_TEXT
para interactuar con ese modelo:
- Para los modelos remotos basados en los modelos Gemini 1.5 o 2.0, puedes usar la función
ML.GENERATE_TEXT
para analizar contenido de texto, imagen, audio, video o PDF a partir de una tabla de objetos con una instrucción que proporcionas como argumento de una función, o puedes generar texto a partir de una instrucción que proporcionas en una consulta o desde una columna en una tabla estándar. - Para los modelos remotos basados en los modelos
gemini-1.0-pro-vision
puedes usar la funciónML.GENERATE_TEXT
para analizar contenido de imagen o video desde una tabla de objetos con un mensaje que proporcionas como argumento de función. - Para los modelos remotos basados en modelos
gemini-1.0-pro
,text-bison
,text-bison-32k
otext-unicorn
, puedes usar la funciónML.GENERATE_TEXT
con un mensaje que proporciones en una consulta o desde una columna en una tabla estándar.
Puedes usar
puesta a tierra
y
atributos de seguridad
cuando usas modelos de Gemini con la función ML.GENERATE_TEXT
,
siempre que uses una tabla estándar para la entrada. Grounding lets the
Gemini model use additional information from the internet to
generate more specific and factual responses. Safety attributes let the
Gemini model filter the responses it returns based on the
attributes you specify.
Cuando creas un modelo remoto que hace referencia a cualquiera de los siguientes modelos, puedes optar por configurar el ajuste supervisado al mismo tiempo:
gemini-1.5-pro-002
gemini-1.5-flash-002
gemini-1.0-pro-002
(vista previa)
Todas las inferencias se producen en Vertex AI. Los resultados se almacenan en BigQuery.
Usa los siguientes temas para probar la generación de texto en BigQuery ML:
- Para generar texto, usa un modelo
Gemini
y la funciónML.GENERATE_TEXT
. - Analiza imágenes con un modelo de visión de Gemini.
- Para generar texto, usa la función
ML.GENERATE_TEXT
con tus datos. - Ajusta un modelo con tus datos.
- Para generar texto, usa un modelo
text-bison
y la funciónML.GENERATE_TEXT
.
Generación de embeddings
Una incorporación es un vector numérico de alta dimensión que representa una entidad determinada, como un fragmento de texto o un archivo de audio. Generar incorporaciones te permite capturar la semántica de tus datos de una manera que facilita su razonamiento y comparación.
Estos son algunos casos de uso comunes para la generación de incorporaciones:
- Usar la generación de aumento de recuperación (RAG) para mejorar las respuestas del modelo a las consultas de los usuarios haciendo referencia a datos adicionales de una fuente confiable La RAG proporciona una mejor precisión fáctica y coherencia de las respuestas, y también brinda acceso a datos más recientes que los datos de entrenamiento del modelo.
- Realizar una búsqueda multimodal Por ejemplo, usar la entrada de texto para buscar imágenes.
- Realizar una búsqueda semántica para encontrar elementos similares para recomendaciones, sustitución y anulación de duplicación de registros
- Crear incorporaciones para usar con un modelo de k-means para el agrupamiento
Modelos compatibles
Se admiten los siguientes modelos:
- Para crear incorporaciones de texto, puedes usar los modelos
text-embedding
ytext-multilingual-embedding
de Vertex AI. - Para crear incorporaciones multimodales, que incorporan texto, imágenes y videos en
el mismo espacio semántico, puedes usar el modelo
multimodalembedding
de Vertex AI. - Para crear incorporaciones para datos estructurados de variables aleatorias independientes (IID), puedes usar un modelo de análisis de componentes principales (PCA) de BigQuery ML o un modelo de codificador automático.
- Si deseas crear incorporaciones para datos de usuarios o elementos, puedes usar un modelo de factorización de matrices de BigQuery ML.
Para una incorporación de texto más ligera y pequeña, prueba usar un modelo previamente entrenado de TensorFlow, como NNLM, SWIVEL o BERT.
Usa modelos de generación de incorporaciones
Después de crear el modelo, puedes usar la función ML.GENERATE_EMBEDDING
para interactuar con él. Para todos los tipos de modelos compatibles, ML.GENERATE_EMBEDDING
funciona con datos en tablas estándar. En el caso de los modelos de incorporación multimodales, ML.GENERATE_EMBEDDING
también funciona con el contenido visual en las tablas de objetos.
En los modelos remotos, toda la inferencia se produce en Vertex AI. Para otros tipos de modelos, toda la inferencia se produce en BigQuery. Los resultados se almacenan en BigQuery.
Usa los siguientes temas para probar la generación de texto en BigQuery ML:
- Genera embeddings de texto con la función
ML.GENERATE_EMBEDDING
- Genera incorporaciones de imágenes con la función
ML.GENERATE_EMBEDDING
- Genera embeddings de video con la función
ML.GENERATE_EMBEDDING
- Genera y busca incorporaciones multimodales
- Realiza búsquedas semánticas y generación de aumento de recuperación
¿Qué sigue?
- Para obtener más información sobre la realización de inferencias sobre los modelos de aprendizaje automático, consulta Descripción general de la inferencia de modelo.