Glosario de IA generativa | Generative AI on Vertex AI

agente

En el contexto de la IA generativa, un agente es un software que planifica y ejecuta de forma autónoma una serie de acciones para alcanzar un objetivo, posiblemente en situaciones nuevas. Los agentes se pueden usar en varias aplicaciones, como el procesamiento del lenguaje natural, el aprendizaje automático y la robótica. Por ejemplo, un agente LLM usa un modelo de lenguaje para evaluar el entorno y elegir una acción que le ayude a alcanzar su objetivo. Los agentes LLM se pueden usar para generar texto, traducir idiomas y responder preguntas.

Endpoint de la API

Endpoints de API es un aspecto de configuración de servicio que especifica las direcciones de red, también conocidas como endpoints de servicio (por ejemplo, aiplatform.googleapis.com).

Credenciales predeterminadas de la aplicación (ADC)

Las credenciales de aplicación predeterminadas (ADC) proporcionan una forma sencilla de obtener credenciales de autorización para usarlas en llamadas a las APIs de Google. Son más adecuadas para los casos en los que la llamada debe tener la misma identidad y nivel de autorización para la aplicación, independientemente del usuario. Este es el método recomendado para autorizar llamadas a las APIs de Google Cloud, sobre todo cuando creas una aplicación que se implementa en Google App Engine (GAE) o en máquinas virtuales de Compute Engine. Para obtener más información, consulta Cómo funcionan las credenciales predeterminadas de la aplicación.

Approximate Nearest Neighbor (ANN)

El servicio de búsqueda del vecino más cercano aproximado (ANN) es una solución de alta escala y baja latencia para encontrar vectores similares (o, más concretamente, "inserciones") en un corpus grande. Para obtener más información, consulta Cómo usar la búsqueda vectorial para la coincidencia semántica.

artefacto

Un artefacto es una entidad o un fragmento de datos discretos que produce y consume un flujo de trabajo de aprendizaje automático. Entre los artefactos se incluyen conjuntos de datos, modelos, archivos de entrada y registros de entrenamiento.

Artifact Registry

Artifact Registry es un servicio de gestión de artefactos universal. Es el servicio recomendado para gestionar contenedores y otros artefactos en Google Cloud. Para obtener más información, consulta Artifact Registry.

Inteligencia artificial (IA)

La inteligencia artificial (IA) es el estudio y el diseño de máquinas que parecen "inteligentes", es decir, que imitan funciones humanas o intelectuales, como el movimiento mecánico, el razonamiento o la resolución de problemas. Uno de los subcampos más populares de la IA es el aprendizaje automático, que utiliza un enfoque estadístico y basado en datos para crear IA. Sin embargo, algunas personas utilizan estos dos términos indistintamente.

Realidad aumentada (RA)

Combinación de contenido digital renderizado con contenido del mundo real, ya sea a través de una pantalla, como la de un teléfono, o como una superposición del mundo que se ve a través de ópticas, como las de unas gafas. El contenido digital debe seguir el movimiento de la cámara o las gafas (en función de cómo se renderice la escena) para que parezca que forma parte del mundo real.

autenticación

Proceso de verificación de la identidad de un cliente (que puede ser un usuario u otro proceso) para obtener acceso a un sistema seguro. Se dice que un cliente que ha demostrado su identidad está autenticado. Para obtener más información, consulta el artículo Métodos de autenticación de Google.

Comparación automática

La comparación automática en paralelo (AutoSxS) es una herramienta de evaluación asistida por modelos que compara dos modelos de lenguaje extensos (LLMs) en paralelo. Se puede usar para evaluar el rendimiento de los modelos de IA generativa del registro de modelos de Vertex AI o de las inferencias pregeneradas. AutoSxS usa un evaluador automático para decidir qué modelo ofrece la mejor respuesta a una petición. AutoSxS está disponible bajo demanda y evalúa modelos de lenguaje con un rendimiento comparable al de los evaluadores humanos.

Reconocimiento de voz automático (ASR,Speech-to-Text)

Transcripción automática de la lengua hablada (voz) a texto.

AutoML

Algoritmos de aprendizaje automático que "aprenden a aprender" mediante la optimización de caja negra. Para obtener más información, consulta el glosario de aprendizaje automático.

autorater

Un evaluador automático es un modelo de lenguaje que evalúa la calidad de las respuestas del modelo a partir de una petición de inferencia original. Se usa en la canalización AutoSxS para comparar las inferencias de dos modelos y determinar cuál ha dado mejores resultados. Para obtener más información, consulta El calificador automático.

valor de referencia

Modelo que se usa como punto de referencia para comparar el rendimiento de otro modelo (normalmente, uno más complejo). Por ejemplo, un modelo de regresión logística puede servir como una buena base para un modelo profundo. En el caso de un problema concreto, la base de referencia ayuda a los desarrolladores de modelos a cuantificar el rendimiento mínimo esperado que debe alcanzar un nuevo modelo para que sea útil. Para obtener más información, consulta Conjuntos de datos de referencia y de destino.

batch

El conjunto de ejemplos que se usa en una iteración de entrenamiento. El tamaño del lote determina el número de ejemplos que contiene.

tamaño del lote

Número de ejemplos de un lote. Por ejemplo, el tamaño del lote de SGD es 1, mientras que el tamaño del lote de un minilote suele estar entre 10 y 1000. El tamaño del lote suele ser fijo durante el entrenamiento y la inferencia. Sin embargo, TensorFlow permite tamaños de lote dinámicos.

inferencia por lotes

La inferencia por lotes toma un grupo de solicitudes de inferencia y genera los resultados en un archivo. Para obtener más información, consulta el resumen de cómo obtener inferencias en Vertex AI.

sesgo

1. Estereotipos, prejuicios o favoritismos hacia determinadas cosas, personas o grupos. Estos sesgos pueden afectar a la recogida e interpretación de datos, al diseño de un sistema y a la forma en que los usuarios interactúan con él. 2. Error sistemático introducido por un procedimiento de muestreo o de generación de informes.

bidireccional

Término que se usa para describir un sistema que evalúa el texto que precede y sigue a una sección de texto de destino. Por el contrario, un sistema unidireccional solo evalúa el texto que precede a una sección de texto de destino.

Representaciones de codificador bidireccional de transformadores (BERT)

BERT es un método de preentrenamiento de representaciones de lenguaje, lo que significa que entrenamos un modelo de "comprensión del lenguaje" de uso general en un corpus de texto grande (como Wikipedia) y, a continuación, usamos ese modelo para tareas de procesamiento del lenguaje natural (PLN) posteriores que nos interesan (como responder preguntas). BERT supera a los métodos anteriores porque es el primer sistema no supervisado y profundamente bidireccional para preentrenar el procesamiento del lenguaje natural.

Suplente de evaluación bilingüe (Bilingual Evaluation Understudy, BLEU)

Una medida habitual para evaluar la calidad de un algoritmo de traducción automática comparando su resultado con el de una o varias traducciones humanas.

Potenciación

En el entrenamiento de modelos, el boosting puede hacer referencia a las técnicas de aumento de datos que se usan para incrementar el tamaño y la diversidad de los conjuntos de datos de entrenamiento. Para ello, se transforman los ejemplos que ya hay para crear otros variados, lo que puede mejorar el rendimiento del modelo, sobre todo cuando el conjunto de datos original es limitado.

cuadro delimitador

Un cuadro delimitador de un objeto en el fotograma de un vídeo se puede especificar de dos formas: i) usando dos vértices que consten de un conjunto de coordenadas x e y si son puntos opuestos en diagonal del rectángulo. Por ejemplo: x_relative_min, y_relative_min,,,x_relative_max,y_relative_max,, (ii) Usa los cuatro vértices. Para obtener más información, consulta Preparar datos de vídeo.

categoría

Carpeta de nivel superior de Cloud Storage. Los nombres de los segmentos deben ser únicos para todos los usuarios de Cloud Storage. Los segmentos contienen archivos. Para obtener más información, consulta la descripción general del producto Cloud Storage.

Cadena de pensamiento

En la IA generativa, la cadena de pensamiento (CoT) es una técnica de petición que anima al modelo de lenguaje extenso (LLM) a detallar explícitamente su proceso de razonamiento antes de llegar a una conclusión. Esto implica pedirle al modelo que muestre los pasos intermedios que sigue para resolver un problema, en lugar de proporcionar solo la respuesta final. Este método puede mejorar significativamente el rendimiento del LLM en tareas de razonamiento complejas.

chat

El contenido de una conversación con un sistema de aprendizaje automático, normalmente un modelo de lenguaje extenso. La interacción anterior en una conversación (lo que has escrito y cómo ha respondido el modelo de lenguaje extenso) se convierte en el contexto de las partes posteriores de la conversación. Un chatbot es una aplicación de un modelo de lenguaje extenso.

punto de control

Datos que registran el estado de los parámetros de un modelo durante el entrenamiento o una vez que este ha finalizado. Por ejemplo, durante el entrenamiento, puedes hacer lo siguiente: 1. Detener el entrenamiento, ya sea de forma intencionada o como resultado de determinados errores. 2. Captura el punto de control. 3. Más adelante, vuelve a cargar el punto de control, posiblemente en otro hardware. 4. Reiniciar el entrenamiento. En Gemini, un punto de control es una versión específica de un modelo de Gemini entrenado con un conjunto de datos concreto.

modelo de clasificación

Modelo cuya inferencia es una clase. Por ejemplo, los siguientes son modelos de clasificación: un modelo que predice el idioma de una frase de entrada (¿francés? ¿Español? italiano?). Un modelo que predice especies de árboles (¿arce? ¿Roble? Baobab?). Modelo que predice la clase positiva o negativa de una afección médica concreta.

métricas de clasificación

Las métricas de clasificación admitidas en el SDK de Vertex AI para Python son la matriz de confusión y la curva ROC.

TPU de Cloud

Un acelerador por hardware especializado diseñado para agilizar las cargas de trabajo de aprendizaje automático en Google Cloud.

agrupación en clústeres

En el contexto de la IA generativa, el agrupamiento en clústeres es una técnica de aprendizaje automático no supervisado que se usa para agrupar puntos de datos similares en función de sus características. Para ello, se define una medida de similitud (o métrica) para comparar los puntos de datos y se agrupan los que tienen una similitud alta en el mismo clúster. En las aplicaciones de IA generativa, esto puede implicar agrupar incrustaciones (representaciones numéricas de texto, imágenes u otros datos) para realizar tareas como búsquedas, clasificaciones o detección de valores atípicos. Por ejemplo, la segmentación de clientes se puede conseguir agrupando los datos de los clientes para identificar grupos con comportamientos o características similares. Para obtener más información, consulta el artículo ¿Qué es la agrupación en clústeres?

imagen del contenedor

Una imagen de contenedor es un paquete que incluye el código ejecutable del componente y una definición del entorno en el que se ejecuta el código. Para obtener más información, consulta el resumen del entrenamiento personalizado.

context

Un contexto se usa para agrupar artefactos y ejecuciones en una sola categoría con tipo y que se puede consultar. Los contextos se pueden usar para representar conjuntos de metadatos. Un ejemplo de contexto sería la ejecución de una canalización de aprendizaje automático.

caché de contexto

Una caché de contexto en Vertex AI es una gran cantidad de datos que se pueden usar en varias solicitudes a un modelo de Gemini. El contenido almacenado en caché se guarda en la región en la que se realiza la solicitud para crear la caché. Puede ser cualquier tipo MIME admitido por los modelos multimodales de Gemini, como texto, audio o vídeo. Para obtener más información, consulta el artículo Introducción al almacenamiento en caché de contexto.

ventana de contexto

Número de tokens que puede procesar un modelo en una petición determinada. Cuanto más grande sea la ventana de contexto, más información podrá usar el modelo para proporcionar respuestas coherentes y consistentes a la petición.

Claves de cifrado gestionadas por el cliente (CMEK)

Las claves de cifrado gestionadas por el cliente (CMEK) son integraciones que permiten a los clientes cifrar datos en servicios de Google con una clave que gestionan en Cloud KMS (también conocido como Storky). La clave de Cloud KMS es la clave de cifrado de claves que protege sus datos. Para obtener más información, consulta Claves de cifrado gestionadas por el cliente (CMEK).

red de VPC de consumidor

Una red de VPC de consumidor es una nube privada virtual (VPC) de Google Cloud que accede de forma privada a un servicio alojado en otra VPC (conocida como VPC de productor). Para obtener más información, consulta Private Service Connect.

análisis de datos

Obtener información sobre los datos teniendo en cuenta las muestras, las mediciones y la visualización. El análisis de datos puede ser especialmente útil cuando se recibe un conjunto de datos por primera vez, antes de crear el primer modelo. También es fundamental para entender los experimentos y depurar los problemas del sistema.

aumento de datos

Aumentar artificialmente el intervalo y el número de ejemplos de entrenamiento transformando los ejemplos actuales para crear más. Por ejemplo, supongamos que las imágenes son una de tus funciones, pero tu conjunto de datos no contiene suficientes ejemplos de imágenes para que el modelo aprenda asociaciones útiles. Lo ideal es que añadas suficientes imágenes etiquetadas a tu conjunto de datos para que el modelo se pueda entrenar correctamente. Si no es posible, el aumento de datos puede rotar, estirar y reflejar cada imagen para producir muchas variantes de la imagen original, lo que puede generar suficientes datos etiquetados para permitir un entrenamiento excelente.

DataFrame

Un tipo de datos de pandas popular para representar conjuntos de datos en la memoria. Un DataFrame es análogo a una tabla o a una hoja de cálculo. Cada columna de un DataFrame tiene un nombre (un encabezado) y cada fila se identifica con un número único. Cada columna de un DataFrame se estructura como una matriz bidimensional, pero a cada columna se le puede asignar su propio tipo de datos.

indexación de datos

En el contexto de la IA generativa, la indexación de datos es el proceso de estructurar y organizar una base de conocimientos para optimizar la búsqueda y la recuperación. Esto implica crear un índice, a menudo llamado corpus, que permite buscar datos de forma eficiente. Este proceso es independiente de la creación de corpus y los datos indexados se pueden usar para enriquecer el contexto de los modelos de lenguaje extensos (LLMs), lo que reduce las alucinaciones y mejora la precisión de las respuestas. Por ejemplo, en el contexto de un sitio web, la indexación de datos puede implicar la adición de metadatos como datePublished y dateModified para mejorar la funcionalidad de búsqueda. Hay diferentes métodos para indexar datos, como usar la búsqueda de vectores para buscar similitudes en aplicaciones como la recuperación de información relevante para LLMs en el momento de la consulta. Para obtener más información, consulta el resumen del motor RAG .

ingestión de datos

La ingestión de datos es el proceso de extraer datos de varias fuentes e integrarlos en una ubicación central para su posterior tratamiento y análisis. En el contexto de la IA generativa, la ingestión de datos consiste en extraer información de diferentes fuentes de datos, como formularios clínicos, historiales de pacientes o texto sin estructurar, para entrenar y ajustar modelos de IA generativa. Los datos ingeridos se suelen procesar y transformar para asegurar su calidad y coherencia antes de usarse para entrenar los modelos de IA generativa. Este proceso puede incluir técnicas de limpieza de datos, ingeniería de características y aumento de datos para mejorar el rendimiento y las capacidades de generalización del modelo. Para obtener más información, consulta Usar la IA generativa para gestionar la utilización.

paralelismo de datos

Una forma de escalar el entrenamiento o la inferencia que replica un modelo completo en varios dispositivos y, a continuación, pasa un subconjunto de los datos de entrada a cada dispositivo. El paralelismo de datos puede permitir el entrenamiento y la inferencia con tamaños de lote muy grandes. Sin embargo, requiere que el modelo sea lo suficientemente pequeño como para caber en todos los dispositivos. El paralelismo de datos suele acelerar el entrenamiento y la inferencia.

conjunto de datos

Un conjunto de datos se define de forma general como una colección de registros de datos estructurados o sin estructurar. Conjunto de datos sin procesar, normalmente (aunque no exclusivamente) organizados en uno de los siguientes formatos: una hoja de cálculo o un archivo en formato CSV (valores separados por comas). Para obtener más información, consulta Crear un conjunto de datos.

transformación de datos

En el contexto de la generación aumentada por recuperación (RAG), la transformación de datos se refiere a la conversión de datos en un formato adecuado para la indexación y el procesamiento por parte de un LLM. Esto suele implicar dividir los datos en fragmentos más pequeños para que se puedan gestionar en la inserción y la indexación. Otras transformaciones pueden incluir pasos de limpieza y validación para asegurar la calidad de los datos. Para obtener más información, consulta el resumen del motor RAG.

decodificador

En general, cualquier sistema de aprendizaje automático que convierta una representación procesada, densa o interna en una representación más sin procesar, dispersa o externa. Los decodificadores suelen ser un componente de un modelo más grande, donde se emparejan con frecuencia con un codificador. En las tareas de secuencia a secuencia, un decodificador empieza con el estado interno generado por el codificador para predecir la siguiente secuencia.

red neuronal profunda (DNN)

Una red neuronal con varias capas ocultas, normalmente programada mediante técnicas de aprendizaje profundo.

profundidad

La suma de los siguientes elementos en una red neuronal: 1. el número de capas ocultas 2. el número de capas de salida, que suele ser uno 3. el número de capas de inserción. Por ejemplo, una red neuronal con cinco capas ocultas y una capa de salida tiene una profundidad de 6. Ten en cuenta que la capa de entrada no influye en la profundidad.

DevOps

DevOps es un paquete de productos de Google Cloud Platform, como Artifact Registry y Cloud Deploy.

detención temprana

Método de regularización que consiste en finalizar el entrenamiento antes de que la pérdida de entrenamiento deje de disminuir. En la detención anticipada, detienes intencionadamente el entrenamiento del modelo cuando la pérdida en un conjunto de datos de validación empieza a aumentar, es decir, cuando el rendimiento de generalización empeora.

inserción

Representaciones numéricas de palabras o fragmentos de texto. Estos números captan el significado semántico y el contexto del texto. Las palabras o el texto similares o relacionados tienden a tener elementos insertados similares, lo que significa que están más cerca en el espacio vectorial de alta dimensión.

espacio de inserción (espacio latente)

En la IA generativa, el espacio de inserción hace referencia a una representación numérica de texto, imágenes o vídeos que captura las relaciones entre las entradas. Los modelos de aprendizaje automático, especialmente los modelos de IA generativa, son expertos en crear estas inserciones identificando patrones en grandes conjuntos de datos. Las aplicaciones pueden utilizar los embeddings para procesar y generar lenguaje, así como para reconocer significados complejos y relaciones semánticas específicos del contenido.

vector de inserción

Representación vectorial densa, a menudo de baja dimensión, de un elemento de forma que, si dos elementos son semánticamente similares, sus respectivas incrustaciones se encuentran cerca una de la otra en el espacio vectorial de incrustación.

encoder

En general, cualquier sistema de aprendizaje automático que convierta una representación sin procesar, dispersa o externa en una representación más procesada, densa o interna. Los codificadores suelen ser un componente de un modelo más grande, donde se emparejan con un decodificador. Algunos transformadores emparejan codificadores con decodificadores, aunque otros transformadores solo usan el codificador o solo el decodificador. Algunos sistemas usan la salida del codificador como entrada para una red de clasificación o regresión. En las tareas de secuencia a secuencia, un codificador toma una secuencia de entrada y devuelve un estado interno (un vector). Después, el decodificador usa ese estado interno para predecir la siguiente secuencia.

conjunto

Conjunto de modelos entrenados de forma independiente cuyas inferencias se promedian o agregan. En muchos casos, un conjunto produce mejores inferencias que un solo modelo. Por ejemplo, un bosque aleatorio es un conjunto creado a partir de varios árboles de decisión. Ten en cuenta que no todos los bosques de decisión son conjuntos.

entorno

En el aprendizaje por refuerzo, el mundo que contiene al agente y le permite observar el estado de ese mundo. Por ejemplo, el mundo representado puede ser un juego como el ajedrez o un mundo físico como un laberinto. Cuando el agente aplica una acción al entorno, este pasa de un estado a otro.

evaluación (eval)

Una evaluación es un tipo de experimento en el que se envían consultas registradas o sintéticas a través de dos pilas de búsqueda: una pila experimental que incluye tu cambio y una pila base que no lo incluye. Las evaluaciones generan diferencias y métricas que te permiten evaluar el impacto, la calidad y otros efectos de los cambios en los resultados de búsqueda y en otras partes de la experiencia de usuario de Google. Las evaluaciones se usan durante la optimización o las iteraciones de tu cambio. También se usan como parte del lanzamiento de un cambio en el tráfico de usuarios activos.

ejecución

Una ejecución es un registro de un paso de un flujo de trabajo de aprendizaje automático, normalmente anotado con sus parámetros de tiempo de ejecución. Entre los ejemplos de ejecuciones se incluyen la ingestión de datos, la validación de datos, el entrenamiento de modelos, la evaluación de modelos y el despliegue de modelos.

Puntuación F1

La puntuación F1 es una métrica que se usa para evaluar la precisión de los resultados de un modelo. Es especialmente útil para evaluar el rendimiento de los modelos en tareas en las que tanto la precisión como la recuperación son importantes, como la extracción de información. En el caso de los modelos de IA generativa, la puntuación F1 se puede usar para comparar las inferencias del modelo con los datos validados en el terreno y determinar la precisión del modelo. Sin embargo, en las tareas generativas, como la creación de resúmenes y la generación de texto, pueden ser más adecuadas otras métricas, como la puntuación Rough-L.

función

En el aprendizaje automático, una característica es una propiedad o un atributo de una instancia o una entidad que se usa como entrada para entrenar un modelo de aprendizaje automático o para hacer inferencias.

extracción de características

En el contexto de la IA generativa, la extracción de características se refiere al proceso de identificar y seleccionar las características relevantes de los datos de entrada que se van a usar en el entrenamiento del modelo. Estas características se usan para generar datos nuevos que se parezcan a los datos de entrada originales. Por ejemplo, en la generación de imágenes, la extracción de características puede implicar la identificación de bordes, texturas y colores. En el procesamiento del lenguaje natural, podría implicar la extracción de palabras clave, frases y estructuras gramaticales. El modelo generativo usa las funciones extraídas para crear contenido nuevo.

servicio de funciones

El servicio de funciones es el proceso de exportar u obtener valores de funciones para el entrenamiento o la inferencia. En Vertex AI, hay dos tipos de servicios de funciones: online y offline. El servicio online obtiene los valores de las funciones más recientes de un subconjunto de la fuente de datos de funciones para las inferencias online. El servicio offline o por lotes exporta grandes volúmenes de datos de características, incluidos datos históricos, para el procesamiento offline, como el entrenamiento de modelos de aprendizaje automático.

vista de funciones

Una vista de características es una colección lógica de características materializadas de una fuente de datos de BigQuery en una instancia de tienda online. Una vista de características almacena y actualiza periódicamente los datos de características del cliente, que se actualizan periódicamente desde la fuente de BigQuery. Una vista de características se asocia al almacenamiento de datos de características directamente o mediante asociaciones a recursos del registro de características.

Petición que incluye varios ejemplos (few-shot)

En la IA generativa, "few-shot" hace referencia a un tipo de petición que incluye un pequeño número de ejemplos para guiar la respuesta del modelo. Estos ejemplos ayudan al modelo a comprender el formato de salida, la redacción, el alcance o el patrón general de la respuesta que se espera. Las peticiones con pocos ejemplos se suelen usar para regular la salida de los modelos de lenguaje, lo que asegura que generen respuestas precisas, de alta calidad y coherentes con las expectativas de los usuarios. Al proporcionar al modelo algunos ejemplos relevantes, el usuario puede influir en su comportamiento y obtener resultados más satisfactorios. Para obtener más información, consulta Incluir ejemplos de pocos disparos.

modelo fundacional (FM)

Modelos entrenados con datos generales para que se puedan adaptar (por ejemplo, mediante un ajuste) a una amplia gama de tareas posteriores.

Operaciones de modelos fundacionales (FMOPs)

FMOps amplía las funciones de MLOps y se centra en la producción eficiente de modelos fundamentales preentrenados (entrenados desde cero) o personalizados (ajustados).

Gemini

Gemini es un conjunto de modelos multimodales grandes basados en secuencias de Google. Esto significa que pueden aceptar entradas y producir salidas en más de un medio a la vez, incluidos texto, audio y medios visuales. Están diseñadas para integrarse con agentes capaces de realizar varias tareas. Para obtener más información, consulta Modelos de Google.

generalización

Capacidad de un modelo para hacer inferencias correctas sobre datos nuevos que no se han visto antes. Un modelo que puede generalizar es lo contrario de un modelo que está sobreajustado.

generación

En el contexto de la IA generativa, la "generación" se refiere al proceso de crear datos o contenido nuevos a partir de datos o información ya disponibles. Los modelos de IA generativa se entrenan con grandes conjuntos de datos y pueden aprender patrones y relaciones dentro de los datos. Después, pueden usar ese conocimiento para generar contenido nuevo y único que sea similar a los datos de entrenamiento, pero no una réplica exacta. Para obtener más información, consulta el artículo Cuándo usar la IA generativa o la IA tradicional.

modelo generativo

Tipo de modelo de aprendizaje automático que puede crear resultados nuevos a partir de sus datos de entrenamiento. En su forma más sencilla, el modelo genera datos nuevos que se parecen a un conjunto de categorías con las que se ha entrenado. Se suele asociar a modelos de lenguaje extensos, pero otros tipos de modelos también pueden ser generativos.

Sistema de módem insertado de Google (GEMS)

GEMS es un framework de software insertado dirigido a módems, así como un conjunto de flujos de trabajo de desarrollo e infraestructura. El objetivo principal de GEMS es proporcionar código de sistema de módem de alta calidad con una gran capacidad de reutilización en muchos dispositivos de Google que contengan módems. Para lograr esta visión general, GEMS proporciona un entorno completo para los desarrolladores, compuesto por los principales componentes que se muestran a continuación.

gradiente

Vector de derivadas parciales con respecto a todas las variables independientes. En el aprendizaje automático, el gradiente es el vector de derivadas parciales de la función del modelo. El gradiente apunta en la dirección de la pendiente más pronunciada.

gráfico

En el contexto de la IA generativa, un gráfico es una representación estructurada de la información que organiza y conecta los datos como una red de nodos y aristas. Estos gráficos se suelen usar para representar conocimientos y relaciones entre entidades, lo que los hace especialmente útiles para los sistemas de IA generativa que requieren un conocimiento profundo del contexto y las relaciones de los datos. Los sistemas de IA generativa que aprovechan los gráficos de conocimiento pueden usarlos para mejorar el rendimiento de los modelos de recuperación. Al incorporar gráficos de conocimiento al sistema, la IA generativa puede acceder a datos con mucho contexto y recorrer el gráfico para recuperar subgráficos relevantes en función de las consultas de los usuarios. De esta forma, el sistema puede ofrecer respuestas más precisas e informativas al generar contenido pertinente en función del contexto.

verdad fundamental (GT)

La verdad fundamental es un término que se usa en varios campos para referirse a la verdad absoluta de un problema de decisión o medición, en contraposición a la estimación de un sistema. En el aprendizaje automático, el término "datos verificados" hace referencia al conjunto de entrenamiento de las técnicas de aprendizaje supervisado.

alucinación

Una alucinación en la IA generativa es una respuesta segura de una IA que no se puede fundamentar en sus datos de entrenamiento. Puede que sea objetivamente incorrecto. En el contexto de la generación de texto, se trata de falsedades aleatorias que suenan plausibles en el contenido de texto generado.

heurística

Una solución sencilla y rápida para un problema. Por ejemplo, "Con una heurística, hemos conseguido una precisión del 86 %. Cuando cambiamos a una red neuronal profunda, la precisión aumentó hasta el 98%".

capa oculta

Una capa de una red neuronal entre la capa de entrada (las características) y la capa de salida (la inferencia). Cada capa oculta consta de una o varias neuronas. Una red neuronal profunda contiene más de una capa oculta.

histograma

Representación gráfica de la variación de un conjunto de datos mediante barras. Un histograma visualiza patrones que son difíciles de detectar en una tabla de números sencilla.

hiperparámetro

Un hiperparámetro es una variable que rige el proceso de entrenamiento de un modelo de aprendizaje automático. Estas variables pueden incluir tasas de aprendizaje, valores de impulso en el optimizador y el número de unidades de la última capa oculta de un modelo. Para obtener más información, consulta el artículo Información general sobre el ajuste de hiperparámetros.

ajuste de hiperparámetros

El ajuste de hiperparámetros en Vertex AI consiste en ejecutar varias pruebas de una aplicación de entrenamiento con diferentes valores para los hiperparámetros elegidos, definidos dentro de unos límites especificados. El objetivo es optimizar los ajustes de los hiperparámetros para maximizar la precisión predictiva del modelo. Para obtener más información, consulta el artículo Información general sobre el ajuste de hiperparámetros.

Permisos de gestión de identidades y accesos (IAM)

Los permisos de Gestión de Identidades y Accesos (IAM) son funciones granulares específicas que definen quién puede hacer qué en los recursos de Google Cloud. Se asignan a entidades principales (como usuarios, grupos o cuentas de servicio) a través de roles, lo que permite controlar con precisión el acceso a los servicios y los datos de un proyecto u organización de Google Cloud. Para obtener más información, consulta Control de acceso con IAM.

Imagen

Imagen es un servicio de IA generativa de texto a imagen disponible a través de la plataforma Vertex AI. Permite a los usuarios generar imágenes originales, editar imágenes, ajustar modelos de estilo o de tema, añadir títulos a imágenes o recibir respuestas a preguntas sobre el contenido de las imágenes. Para obtener más información, consulta la descripción general de Imagen en Vertex AI.

reconocimiento de imágenes

El reconocimiento de imágenes es el proceso de clasificar objetos, patrones o conceptos en una imagen. También se conoce como clasificación de imágenes. El reconocimiento de imágenes es un subcampo del aprendizaje automático y la visión artificial.

índice

Conjunto de vectores que se implementan juntos para realizar búsquedas por similitud. Los vectores se pueden añadir o quitar de un índice. Las consultas de búsqueda por similitud se envían a un índice específico y buscan entre los vectores de ese índice.

inferencia

En el contexto de la plataforma Vertex AI, la inferencia se refiere al proceso de ejecutar puntos de datos a través de un modelo de aprendizaje automático para calcular un resultado, como una única puntuación numérica. Este proceso también se conoce como "operacionalización de un modelo de aprendizaje automático" o "puesta en producción de un modelo de aprendizaje automático". La inferencia es un paso importante en el flujo de trabajo del aprendizaje automático, ya que permite que los modelos se usen para hacer inferencias sobre datos nuevos. En Vertex AI, la inferencia se puede realizar de varias formas, como la inferencia por lotes y la inferencia online. La inferencia por lotes consiste en ejecutar un grupo de solicitudes de inferencia y generar los resultados en un archivo, mientras que la inferencia online permite realizar inferencias en tiempo real sobre puntos de datos individuales.

Recuperación de información (RI)

La extracción de información es un componente clave de Vertex AI Search. Es el proceso de buscar y recuperar información relevante de una gran colección de datos. En el contexto de Vertex AI, la recuperación de información se usa para obtener documentos de un corpus en función de la consulta de un usuario. Vertex AI ofrece un conjunto de APIs que te ayudan a crear tus propias aplicaciones de generación aumentada por recuperación (RAG) o tu propio motor de búsqueda. Para obtener más información, consulta Usar Vertex AI Search como backend de extracción con RAG Engine.

Infraestructura como código (IaC)

Infraestructura como código. Un enfoque para gestionar la infraestructura de TI en el que los equipos pueden gestionar y aprovisionar servicios mediante código. Con IaC, se crean archivos de configuración que contienen las especificaciones de la infraestructura, lo que facilita la creación y edición de la infraestructura a gran escala.

Infraestructura como código (IaC)

Infraestructura como código. Un enfoque para gestionar la infraestructura de TI en el que los equipos pueden gestionar y aprovisionar servicios mediante código. Con IaC, se crean archivos de configuración que contienen las especificaciones de la infraestructura, lo que facilita la creación y edición de la infraestructura a gran escala.

pérdida (coste)

Durante el entrenamiento de un modelo supervisado, es una medida de la distancia entre la inferencia de un modelo y su etiqueta. Una función de pérdida calcula la pérdida.

conjunto de datos gestionado

Un objeto de conjunto de datos creado y alojado en Vertex AI.

modelo

Cualquier modelo, preentrenado o no. En general, cualquier estructura matemática que procese datos de entrada y devuelva datos de salida. Dicho de otro modo, un modelo es el conjunto de parámetros y la estructura que necesita un sistema para hacer inferencias.

destilación de modelos (destilación de conocimientos, modelos profesor-alumno)

La destilación de modelos es una técnica que permite que un modelo de alumno más pequeño aprenda de un modelo de profesor más grande. El modelo alumno se entrena para imitar la salida del modelo profesor y, a continuación, se puede usar para generar datos nuevos o hacer inferencias. La destilación de modelos se suele usar para que los modelos grandes sean más eficientes o para que los dispositivos con recursos limitados puedan acceder a ellos. También se puede usar para mejorar la generalización de los modelos reduciendo el sobreajuste.

Monitorización de modelos

Vertex AI Model Monitoring es un servicio que evalúa continuamente el rendimiento de los modelos desplegados detectando la desviación y el desfase de las características en las solicitudes de predicción, lo que ayuda a mantener la calidad de los modelos a lo largo del tiempo. Para obtener más información, consulta la introducción a Vertex AI Model Monitoring.

Nombre del recurso de modelo

El nombre de recurso de un model es el siguiente: projects/<PROJECT_ID>/locations/<LOCATION_ID>/models/<MODEL_ID>. Puedes encontrar el ID del modelo en la consola de Cloud, en la página Registro de modelos.

Sistema de archivos de red (NFS)

Sistema cliente/servidor que permite a los usuarios acceder a archivos a través de una red y tratarlos como si estuvieran en un directorio de archivos local. Para obtener más información, consulta Montar un recurso compartido NFS para el entrenamiento personalizado.

Codificación one-hot

La codificación one-hot representa cada categoría como un vector de N elementos (donde N es el número de categorías) con exactamente un elemento que tiene el valor 1,0 y todos los elementos restantes que tienen el valor 0,0. Para obtener más información, consulta Codificación one-hot.

petición con un solo ejemplo

Una petición que contiene un ejemplo que muestra cómo debe responder el modelo de lenguaje extenso. Para obtener más información, consulta Petición única.

parámetro

Los parámetros son valores de entrada con clave que configuran una ejecución, regulan su comportamiento y afectan a sus resultados. Por ejemplo, la tasa de aprendizaje, la tasa de abandono y el número de pasos de entrenamiento.

Perplejidad

La perplejidad es una métrica que se usa para evaluar el rendimiento de los modelos de lenguaje. Mide la probabilidad de que el modelo genere una secuencia de texto determinada en función de la distribución del texto con el que se ha entrenado. La perplejidad es una métrica que se usa habitualmente para evaluar modelos de lenguaje y que se suele utilizar para comparar el rendimiento de diferentes modelos o para monitorizar el progreso de un modelo durante el entrenamiento.

pipeline

Los flujos de procesamiento de aprendizaje automático son flujos de trabajo de aprendizaje automático portátiles y escalables basados en contenedores. Para obtener más información, consulta la introducción a Vertex AI Pipelines.

trabajo de flujo de procesamiento

Una tarea o una ejecución de un flujo de procesamiento corresponde al recurso PipelineJob de la API Vertex AI. Es una instancia de ejecución de la definición de tu canalización de AA, que se define como un conjunto de tareas de AA interconectadas por dependencias de entrada y salida.

ejecución de flujo de procesamiento

Se pueden asociar uno o varios Vertex PipelineJobs a un experimento, donde cada PipelineJob se representa como una sola ejecución. En este contexto, los parámetros de la ejecución se infieren a partir de los parámetros de PipelineJob. Las métricas se infieren del sistema.Artefactos de métricas producidos por ese PipelineJob. Los artefactos de la ejecución se infieren a partir de los artefactos producidos por ese PipelineJob.

acceso privado a servicios

El acceso a servicios privados es una conexión privada entre tu red de nube privada virtual (VPC) y las redes propiedad de Google o de proveedores de servicios externos. Permite que las instancias de máquina virtual (VM) de tu red VPC se comuniquen con estos servicios mediante direcciones IP internas, lo que evita la exposición a Internet público. Para obtener más información, consulta Acceso a servicios privados.

petición

Una petición es una solicitud en lenguaje natural que se envía a un modelo de lenguaje para recibir una respuesta. Las peticiones pueden contener preguntas, instrucciones, información contextual, ejemplos de pocas tomas y entradas parciales para que el modelo las complete o continúe. Después de recibir una petición, el modelo puede generar texto, incrustaciones, código, imágenes, vídeos, música y más, en función del tipo de modelo que se utilice. Para obtener más información, consulta Descripción general de las estrategias de peticiones.

ingeniería de peticiones (diseño de peticiones)

La ingeniería de peticiones en la IA generativa es el proceso de crear peticiones eficaces para obtener los resultados deseados de los modelos de lenguaje extensos (LLMs). Es un proceso iterativo basado en pruebas que se centra en perfeccionar las entradas para conseguir resultados específicos. Esto implica tener en cuenta tanto el contenido como la estructura de la petición para asegurar que las respuestas sean precisas y de alta calidad. La ingeniería de peticiones eficaz es fundamental para las tareas complejas, aunque las más sencillas no la requieran. El objetivo es crear prototipos rápidamente de aplicaciones basadas en LLMs. Para obtener más información, consulta Introducción a la ingeniería de peticiones.

ajuste de peticiones

El ajuste de peticiones es un método de ajuste fino eficiente de parámetros que se usa para mejorar el rendimiento de un modelo de IA generativa en una tarea específica. Consiste en aprender un "prefijo" que se añade al principio de la petición real, a veces en cada capa. Este enfoque se considera más barato y rápido que otros métodos de ajuste, y suele dar buenos resultados. El ajuste de peticiones es especialmente eficaz cuando tienes una tarea específica y quieres que el modelo la realice de una forma determinada. También se conoce como aprendizaje de peticiones o ajuste (fino) eficiente de parámetros. Para obtener más información, consulta Introducción a la ingeniería de peticiones.

Capacidad de procesamiento reservada (PT)

El servicio de rendimiento aprovisionado es un servicio premium para los modelos de IA generativa de Vertex AI que ofrece una experiencia garantizada mediante la garantía de capacidad y precios predecibles. A diferencia de la opción de pago por uso (según demanda), la prueba de producto permite a los clientes comprar una cuota específica, lo que asegura que sus solicitudes no compitan con otras por la capacidad del modelo. PT es una suscripción mensual o semanal de coste fijo que reserva el rendimiento de modelos y ubicaciones específicos. Para obtener más información, consulta la descripción general de Provisioned Throughput.

cuantización

La cuantización es una técnica de optimización de modelos que se usa para reducir la precisión de los números que se utilizan para representar los parámetros de un modelo. Esto puede dar lugar a modelos más pequeños, un menor consumo de energía y una latencia de inferencia reducida.

Bosque aleatorio

Bosque aleatorio es un algoritmo de aprendizaje automático que se usa tanto para la clasificación como para la regresión. No es un modelo de IA generativa en sí, sino un componente que se puede usar en un sistema de IA generativa más grande. Un bosque aleatorio consta de varios árboles de decisión y su inferencia es una agregación de las inferencias de estos árboles individuales. Por ejemplo, en una tarea de clasificación, cada árbol "vota" por una clase y la inferencia final es la clase con más votos. Para obtener más información, consulta Bosque de decisión.

Clúster de Ray en Vertex AI

Un clúster de Ray en Vertex AI es un clúster gestionado de nodos de computación que se puede usar para ejecutar aplicaciones de aprendizaje automático (ML) y Python distribuidas. Proporciona la infraestructura para realizar computación distribuida y procesamiento paralelo en tu flujo de trabajo de aprendizaje automático. Los clústeres de Ray están integrados en Vertex AI para asegurar la disponibilidad de capacidad en cargas de trabajo de aprendizaje automático críticas o durante las temporadas altas. A diferencia de las tareas personalizadas, en las que el servicio de entrenamiento libera el recurso una vez que se completa la tarea, los clústeres de Ray permanecen disponibles hasta que se eliminan. Para obtener más información, consulta la descripción general de Ray en Vertex AI.

Ray en Vertex AI (RoV)

Ray en Vertex AI se ha diseñado para que puedas usar el mismo código de Ray de código abierto para escribir programas y desarrollar aplicaciones en Vertex AI con cambios mínimos. Para obtener más información, consulta la descripción general de Ray en Vertex AI.

SDK de Ray en Vertex AI para Python

El SDK de Ray en Vertex AI para Python es una versión del SDK de Vertex AI para Python que incluye la funcionalidad de Ray Client, el conector Ray BigQuery, la gestión de clústeres de Ray en Vertex AI y las inferencias en Vertex AI. Para obtener más información, consulta la introducción al SDK de Vertex AI para Python.

retirar

Porcentaje de vecinos más cercanos reales devueltos por el índice. Por ejemplo, si una consulta de los vecinos más cercanos para los 20 vecinos más cercanos devolvió 19 de los vecinos más cercanos "reales", el recall es 19/20 × 100 = 95%.

sistema de recomendación

Un sistema de recomendaciones es un sistema basado en aprendizaje automático que ayuda a los usuarios a encontrar contenido atractivo en un corpus grande. Genera un subconjunto más pequeño de candidatos a partir de un corpus potencialmente enorme, puntúa y clasifica a los candidatos, y vuelve a clasificar la lista final para tener en cuenta las restricciones adicionales. Para obtener más información, consulta el artículo Introducción a los sistemas de recomendación.

regularización

La regularización es una técnica que se usa para evitar el sobreajuste en los modelos de aprendizaje automático. El sobreajuste se produce cuando un modelo aprende demasiado bien los datos de entrenamiento, lo que da como resultado un rendimiento deficiente en los datos no vistos. Un tipo específico de regularización que se menciona es la detención anticipada, en la que el entrenamiento se detiene antes de que la pérdida en un conjunto de datos de validación empiece a aumentar, lo que indica una disminución del rendimiento de generalización. Para obtener más información, consulta Sobreajuste: regularización L2.

Aprendizaje por refuerzo

Tipo de aprendizaje automático en el que un agente aprende a tomar decisiones realizando acciones en un entorno para maximizar una recompensa acumulativa. Para obtener más información, consulta Ajuste de RLHF con Vertex AI.

cuenta de servicio

Las cuentas de servicio son cuentas especiales de Google Cloud que usan las aplicaciones o las máquinas virtuales para hacer llamadas a las APIs autorizadas de los servicios de Google Cloud. A diferencia de las cuentas de usuario, no están vinculadas a una persona, sino que actúan como una identidad para tu código, lo que permite acceder a los recursos de forma segura y programática sin necesidad de credenciales de usuario. Para obtener más información, consulta el artículo Resumen de las cuentas de servicio.

agente de servicio

Un agente de servicio es una cuenta de servicio gestionada por Google. Se utiliza cuando un servicio requiere acceso a recursos creados por otro servicio. Por ejemplo, cuando los servicios de Dataflow o Dataproc necesitan crear instancias durante el tiempo de ejecución o cuando una función de Cloud quiere usar Key Management Service (KMS) para proteger la función de Cloud. Google Cloud crea automáticamente los agentes de servicio cuando un servicio los necesita. Normalmente, se usan para gestionar el acceso a los recursos y realizar varias tareas en nombre del servicio. Para obtener más información, consulta Agentes de servicio.

Métricas de resumen

Las métricas de resumen son un valor único para cada clave de métrica de una prueba. Por ejemplo, la exactitud de prueba de un experimento es la exactitud calculada con respecto a un conjunto de datos de prueba al final del entrenamiento, que se puede registrar como una métrica de resumen de un solo valor.

TensorBoard

TensorBoard es un conjunto de aplicaciones web para visualizar y comprender las ejecuciones y los modelos de TensorFlow. Para obtener más información, consulta TensorBoard.

Instancia de TensorBoard

Una instancia de TensorBoard es un recurso regionalizado que almacena experimentos de Vertex AI TensorBoard asociados a un proyecto. Puedes crear varias instancias de TensorBoard en un proyecto si, por ejemplo, quieres que varias instancias tengan habilitada la CMEK. Es lo mismo que el recurso TensorBoard en la API.

Nombre del recurso TensorBoard

Un nombre de recurso de TensorBoard se usa para identificar por completo una instancia de Vertex AI TensorBoard. El formato es el siguiente: projects/PROJECT_ID_OR_NUMBER/locations/REGION/tensorboards/TENSORBOARD_INSTANCE_ID.

Diferencia horaria

El desfase de tiempo es relativo al inicio de un vídeo.

Métricas de series temporales

Las métricas de series temporales son valores de métricas longitudinales en los que cada valor representa un paso de la parte de entrenamiento de una carrera. Las métricas de series temporales se almacenan en Vertex AI TensorBoard. Vertex AI Experiments almacena una referencia al recurso Vertex TensorBoard.

token

Un token en un modelo de lenguaje es la unidad atómica con la que se entrena el modelo y sobre la que hace inferencias, es decir, palabras, morfemas y caracteres. En dominios ajenos a los modelos de lenguaje, los tokens pueden representar otros tipos de unidades atómicas. Por ejemplo, en la visión artificial, un token puede ser un subconjunto de una imagen. Para obtener más información, consulta List and count tokens (Listar y contar tokens).

trayectoria

Una "trayectoria" es una secuencia de pasos o acciones que lleva a cabo un agente o un modelo. Se suele usar en la evaluación de modelos generativos, donde se valora la capacidad del modelo para generar texto, código u otro contenido. Hay varios tipos de métricas de trayectoria que se pueden usar para evaluar modelos generativos, como la concordancia exacta de la trayectoria, la concordancia de la trayectoria en orden, la concordancia de la trayectoria en cualquier orden y la precisión de la trayectoria. Estas métricas miden la similitud entre el resultado del modelo y un conjunto de resultados de referencia generados por personas.

Transformador

Un "transformador" es una arquitectura de red neuronal en la que se basan la mayoría de los modelos generativos más avanzados. Se usa en varias aplicaciones de modelos de lenguaje, incluida la traducción. Los transformadores constan de un codificador y un decodificador. El codificador convierte el texto de entrada en una representación intermedia y el decodificador lo convierte en una salida útil. Utilizan un mecanismo de autoatención para obtener contexto de las palabras que rodean a la palabra que se está procesando. Aunque entrenar un Transformer requiere muchos recursos, afinar un Transformer preentrenado para aplicaciones específicas es más eficiente.

Aprendizaje por refuerzo con transformadores

El aprendizaje por refuerzo con transformadores (TRL) hace referencia a la aplicación de técnicas de aprendizaje por refuerzo (RL) para entrenar modelos basados en transformadores en tareas generativas. Este enfoque aborda las limitaciones de los modelos generativos tradicionales, que suelen entrenarse en la inferencia del siguiente token sin una optimización explícita de las cualidades deseables, como la coherencia, la seguridad y la sensatez. TRL optimiza directamente el modelo de lenguaje en objetivos complejos mediante el aprendizaje por refuerzo, que a menudo incorpora comentarios humanos (RLHF) para guiar el proceso de aprendizaje. Por ejemplo, se pueden perfeccionar modelos para que generen contenido menos tóxico mediante modelos de recompensa y usar TRL para perfeccionar Gemma, un modelo generativo. Para obtener más información, consulta Hugging Face DLCs: Fine-tuning Gemma with Transformer Reinforcement Learning (TRL) on Vertex AI (DLCs de Hugging Face: ajuste fino de Gemma con aprendizaje por refuerzo de transformadores [TRL] en Vertex AI).

verdadero positivo

Un "verdadero positivo" es una inferencia en la que el modelo identifica correctamente una clase positiva. Por ejemplo, si un modelo se entrena para identificar a los clientes que comprarán una chaqueta, un verdadero positivo sería predecir correctamente que un cliente hará esa compra.

validación

La validación comprueba la calidad de las inferencias de un modelo con el conjunto de validación. Esto implica definir métricas para medir la calidad, la velocidad, el cumplimiento de las instrucciones y la seguridad del contenido generado. En la validación, a menudo se usan datos etiquetados (peticiones de entrada y resultados esperados) para comparar las inferencias del modelo con los datos validados. Se pueden usar métricas como la puntuación F1 (para la clasificación) y la puntuación ROUGE-L (para la creación de resúmenes). El proceso también incluye pruebas de casos límite y situaciones inusuales para asegurar la solidez. En el caso de los modelos implementados, la monitorización continua y la captura de puntos de datos comunes y casos límite ayudan a mejorar las futuras validaciones.

vector

Un vector es una representación numérica de texto, imágenes o vídeos que captura las relaciones entre las entradas. Los modelos de aprendizaje automático son adecuados para crear representaciones identificando patrones en grandes conjuntos de datos. Las aplicaciones pueden usar embeddings para procesar y generar lenguaje, así como para reconocer significados complejos y relaciones semánticas específicas del contenido. Para obtener más información, consulta la descripción general de las APIs Embeddings.

Vertex AI Agent Engine

Vertex AI Agent Engine, que forma parte de la plataforma Vertex AI, es un conjunto de servicios que permite a los desarrolladores desplegar, gestionar y escalar agentes de IA en producción. Agent Engine se encarga de la infraestructura para escalar los agentes en producción, de forma que puedas centrarte en crear aplicaciones. Para obtener más información, consulta la descripción general de Vertex AI Agent Engine.

Vertex AI Experiments

Vertex AI Experiments permite a los usuarios hacer un seguimiento de lo siguiente: 1. Pasos de una ejecución de un experimento (por ejemplo, preprocesamiento y entrenamiento). 2. Entradas (por ejemplo, algoritmos, parámetros y conjuntos de datos). 3. Resultados de esos pasos (por ejemplo, modelos, puntos de control y métricas).

Inferencia de Vertex AI

Un servicio de Vertex AI que te permite usar un modelo de aprendizaje automático (ML) entrenado para hacer inferencias a partir de datos nuevos que no se han visto antes. Vertex AI ofrece servicios para desplegar modelos de inferencia. Para obtener más información, consulta Obtener inferencias de un modelo entrenado personalizado.

Registro de modelos de Vertex AI

El registro de modelos de Vertex AI es un repositorio central en el que puedes gestionar el ciclo de vida de tus modelos de aprendizaje automático. En el registro de modelos de Vertex AI, puedes ver un resumen de tus modelos para organizarlos, monitorizarlos y entrenar nuevas versiones de forma más eficaz. Cuando tengas una versión de un modelo que quieras desplegar, puedes asignarla a un endpoint directamente desde el registro o desplegar modelos en un endpoint mediante alias. Para obtener más información, consulta la introducción al registro de modelos de Vertex AI.

segmento de vídeo

Un segmento de vídeo se identifica por el desfase de tiempo de inicio y finalización de un vídeo.

Nube privada virtual (VPC)

Una nube privada segura y aislada alojada en una nube pública que te permite definir una red virtual aislada lógicamente de otras redes virtuales en Google Cloud. Para obtener más información, consulta Nube privada virtual.

incrustación de palabras

Las inserciones de palabras son una forma de representar palabras como vectores densos de valores de coma flotante. De esta forma, las palabras similares tienen codificaciones similares. Las representaciones de palabras se suelen usar en la IA generativa para captar las relaciones entre palabras y generar texto o código nuevos sin fuentes. En la IA generativa, las incrustaciones de palabras se pueden usar para entrenar modelos que puedan generar texto o código nuevos. Al comprender las relaciones entre las palabras, los modelos de IA generativa pueden crear contenido nuevo que sea coherente y relevante.

Petición sin ejemplos (petición directa)

En la IA generativa, una petición sin ejemplos es una petición que permite a un modelo de lenguaje extenso (LLM) realizar una tarea sin entrenamiento ni ejemplos adicionales. Esto contrasta con métodos como el de las peticiones con pocos ejemplos, que proporciona al modelo ejemplos de entradas y salidas. Una petición de clasificación cero se basa únicamente en los conocimientos preexistentes del modelo para generar una respuesta. Para obtener más información, consulta la petición zero-shot.