Glosario de IA generativa

  • Credenciales predeterminadas de la aplicación (ADC)
    • Las credenciales predeterminadas de la aplicación (ADC) proporcionan una forma sencilla de obtener credenciales de autorización para usarlas en llamadas a las APIs de Google. Son más adecuadas para los casos en los que la llamada debe tener la misma identidad y nivel de autorización para la aplicación, independientemente del usuario. Este es el enfoque recomendado para autorizar llamadas a las APIs de Google Cloud, en especial cuando compilas una aplicación que se implementará en las máquinas virtuales de Google App Engine (GAE) o Compute Engine. Para obtener más información, consulta Cómo funcionan las credenciales predeterminadas de la aplicación.
  • Inteligencia artificial (IA)
    • La inteligencia artificial (IA) es el estudio y el diseño de máquinas que parecen ser inteligentes, es decir, que imitan funciones humanas o intelectuales, como el movimiento mecánico, el razonamiento o la resolución de problemas. Uno de los subcampos más populares de la IA es el aprendizaje automático, que utiliza un enfoque estadístico y basado en datos para crear IA. Sin embargo, algunas personas usan estos dos términos de forma indistinta.
  • Realidad aumentada (RA)
    • Combina contenido digital renderizado con contenido del mundo real, ya sea a través de una pantalla, como en un teléfono, o como una superposición del mundo que se ve a través de ópticas, como anteojos. Se debe hacer un seguimiento del contenido digital en función del movimiento de la cámara o los lentes (según cómo se renderice la escena) para que parezca parte del mundo real.
  • Reconocimiento de voz automático (ASR,voz a texto)
    • Es la transcripción automática de lenguaje hablado (voz) a texto.
  • autenticación
    • El proceso de verificar la identidad de un cliente (que puede ser un usuario o algún otro proceso) con el fin de obtener acceso a un sistema seguro. Se dice que un cliente que ha probado su identidad está autenticado. Para obtener más información, consulta Métodos de autenticación en Google.
  • AutoML
    • Algoritmos de aprendizaje automático que "aprenden a aprender" mediante la optimización de caja negra. Para obtener más información, consulta el Glosario de AA.
  • grupo de referencia
    • Es un modelo que se usa como punto de referencia para comparar el rendimiento de otro modelo (por lo general, uno más complejo). Por ejemplo, un modelo de regresión logística podría servir como un buen modelo de referencia para un modelo profundo. En el caso de un problema en particular, el modelo de referencia ayuda a los desarrolladores de modelos a cuantificar el rendimiento mínimo esperado que debe alcanzar un modelo nuevo para que sea útil. Para obtener más información, consulta Conjuntos de datos de referencia y de destino.
  • batch
    • Es el conjunto de ejemplos que se usan en una iteración de entrenamiento. El tamaño del lote determina la cantidad de ejemplos que hay en un lote.
  • tamaño del lote
    • Es la cantidad de ejemplos que hay en un lote. Por ejemplo, el tamaño del lote de SGD es 1, mientras que el tamaño del lote de un minilote suele estar entre 10 y 1,000. Por lo general, se fija el tamaño del lote durante el entrenamiento y la inferencia; sin embargo, TensorFlow permite tamaños de lotes dinámicos.
  • sesgo
    • 1. Estereotipo, prejuicio o preferencia de objetos, personas o grupos por sobre otros. Estos sesgos pueden afectar la recolección y la interpretación de datos, el diseño de un sistema y cómo los usuarios interactúan con él. 2. Error sistemático debido a un procedimiento de muestreo o de elaboración de informes.
  • bidireccional
    • Es un término que se usa para describir un sistema que evalúa el texto que precede y sigue a una sección de texto objetivo. Por el contrario, un sistema unidireccional solo evalúa el texto que precede a una sección de texto objetivo.
  • Representaciones de codificador bidireccional de transformadores (BERT)
    • BERT es un método para realizar un entrenamiento previo de representaciones lingüísticas, lo que significa que entrenamos un modelo de comprensión del lenguaje de uso general en un gran corpus de texto (como Wikipedia) y, luego, usamos ese modelo para las tareas de PLN descendentes que nos interesan (como responder preguntas). BERT supera a los métodos anteriores porque es el primer sistema no supervisado y profundamente bidireccional para el entrenamiento previo del PLN.
  • Bilingual Evaluation Understudy (BLEU)
    • Es una medida popular para evaluar la calidad de un algoritmo de traducción automática comparando su resultado con el de una o más traducciones humanas.
  • cuadro de límite
    • Un cuadro de límite para un objeto en el marco de video se puede especificar de una de dos maneras (i) Mediante 2 vértices que consisten en un conjunto de coordenadas x,y si son puntos diagonalmente opuestos del rectángulo. Por ejemplo: x_relative_min, y_relative_min,,,x_relative_max,y_relative_max,, (ii) Usar los 4 vértices. Para obtener más información, consulta Prepara datos de video.
  • chat
    • El contenido de un diálogo de ida y vuelta con un sistema de AA, por lo general, un modelo de lenguaje grande. La interacción anterior en un chat (lo que escribiste y cómo respondió el modelo de lenguaje extenso) se convierte en el contexto para las partes posteriores del chat. Un chatbot es una aplicación de un modelo de lenguaje extenso.
  • Punto de control
    • Datos que capturan el estado de los parámetros de un modelo, ya sea durante el entrenamiento o después de que este se completa. Por ejemplo, durante el entrenamiento, puedes hacer lo siguiente: 1. Detener el entrenamiento, ya sea de forma intencional o como resultado de ciertos errores 2. Captura el punto de control. 3. Más tarde, vuelve a cargar el punto de control, posiblemente en hardware diferente. 4. Reinicia el entrenamiento. En Gemini, un punto de control hace referencia a una versión específica de un modelo de Gemini entrenado en un conjunto de datos específico.
  • modelo de clasificación
    • Un modelo cuya predicción es una clase. Por ejemplo, los siguientes son todos modelos de clasificación: Un modelo que predice el idioma de una oración de entrada (¿francés? ¿Español? ¿Italiano?). Un modelo que predice especies de árboles (¿arce? ¿Roble? Baobab?). Un modelo que predice la clase positiva o negativa para una afección médica en particular.
  • Cloud TPU
    • Un acelerador de hardware especializado diseñado para acelerar las cargas de trabajo de aprendizaje automático en Google Cloud.
  • ventana de contexto
    • Es la cantidad de tokens que un modelo puede procesar en una instrucción determinada. Cuanto más grande sea la ventana de contexto, más información podrá usar el modelo para proporcionar respuestas coherentes y consistentes a la instrucción.
  • análisis de datos
    • El proceso de obtener una comprensión de los datos mediante la consideración de muestras, mediciones y visualizaciones. El análisis de datos puede ser particularmente útil cuando se recibe por primera vez un conjunto de datos, antes de crear el primer modelo. También es crucial para comprender los experimentos y problemas de depuración del sistema.
  • magnificación de datos
    • Se incrementa de forma artificial el rango y cantidad de ejemplos de entrenamiento a través de transformaciones sobre los ejemplos existentes para crear ejemplos nuevos. Por ejemplo, supongamos que uno de los atributos es "imágenes", pero el conjunto de datos no tiene suficientes ejemplos de imágenes para que el modelo aprenda asociaciones útiles. Lo ideal sería agregar suficientes imágenes etiquetadas al conjunto de datos para permitir que el modelo se entrene adecuadamente. Si eso no es posible, la magnificación de datos puede rotar, estirar y reflejar cada imagen para producir variantes de la imagen original, lo que producirá, posiblemente, suficientes datos etiquetados para permitir un excelente entrenamiento.
  • DataFrame
    • Es un tipo de datos de pandas popular para representar conjuntos de datos en la memoria. Un DataFrame es similar a una tabla o una hoja de cálculo. Cada columna de un DataFrame tiene un nombre (un encabezado) y cada fila se identifica con un número único.Cada columna de un DataFrame está estructurada como un array 2D, excepto que a cada columna se le puede asignar su propio tipo de datos.
  • paralelismo de datos
    • Para obtener más información, consulta .
  • conjunto de datos
    • En términos generales, un conjunto de datos se define como una colección de registros de datos estructurados o no estructurados. Es una colección de datos sin procesar, que suelen (pero no exclusivamente) organizarse en uno de los siguientes formatos: una hoja de cálculo o un archivo en formato CSV (valores separados por comas). Para obtener más información, consulta Crea un conjunto de datos.
  • Verdad fundamental
    • Un término que se refiere a la verificación del aprendizaje automático para la exactitud en el mundo real, como un conjunto de datos de verdad fundamental.
  • pérdida (costo)
    • Durante el entrenamiento de un modelo supervisado, es una medida de qué tan lejos está la predicción de un modelo de su etiqueta. Una función de pérdida calcula la pérdida.
  • model
    • Cualquier modelo previamente entrenado o no. En general, cualquier construcción matemática que procese datos de entrada y muestre resultados. Dicho de otra manera, un modelo es el conjunto de parámetros y estructura necesarios para que un sistema realice predicciones.
  • trabajo de canalización
    • Un trabajo o una ejecución de canalización corresponde al recurso PipelineJob en la API de Vertex AI. Es una instancia de ejecución de la definición de tu canalización de AA, que se define como un conjunto de tareas de AA interconectadas por dependencias de entrada y salida.