Los modelos de base, a veces conocidos como modelos fundamentales, son modelos de inteligencia artificial (IA) potentes que se entrenan con una gran cantidad de datos y se pueden adaptar a una amplia variedad de tareas. El término “modelo de base” fue acuñado por el Stanford Institute for Human-Centered Artificial Intelligence (HAI) en 2021.
Esta tecnología ofrece nuevas posibilidades en todas las industrias, desde la optimización del desarrollo de software hasta la mejora de las interacciones de atención al cliente.
Los modelos de base son un tipo de modelo de IA que se somete a un entrenamiento previo con una gran cantidad de datos para realizar una variedad de tareas. Este proceso de entrenamiento, que a menudo utiliza el aprendizaje auto supervisado, les permite aprender patrones y relaciones complejos dentro de los datos, lo que les ayuda a realizar diversas tareas con mayor exactitud. Lo que es más importante, esta escala masiva puede generar capacidades emergentes, en las que el modelo puede completar tareas para las que no se entrenó de forma explícita. Este cambio de herramientas especializadas a modelos adaptables de uso general es el sello distintivo del paradigma de los modelos de base.
Los términos “modelo de base” y “modelo de lenguaje grande” (LLM) suelen usarse indistintamente, pero hay una diferencia clave. Los LLM son un tipo importante de modelo de base, pero no son el único. Piensa en ello como una relación entre padres e hijos: todos los LLM son modelos de base, pero no todos los modelos de base son LLM.
La diferencia clave es el tipo de datos en los que se basan. Los LLM, como su nombre lo indica, se entrenan específicamente con grandes cantidades de texto y código. La categoría más amplia de “modelos de base” también incluye modelos entrenados con otros tipos de datos, como imágenes, audio y video, o una combinación de ellos (multimodales).
La IA generativa y los modelos de base son distintos, pero están estrechamente relacionados. La forma más útil de entender la diferencia es pensar en ellos como el “motor” frente a la “función”:
Si bien la mayoría de los modelos de base populares se usan para tareas generativas, un modelo de base podría adaptarse para propósitos no generativos, como la clasificación o el análisis complejos. Por lo tanto, no todos los modelos de base son inherentemente generativos, pero son la tecnología clave que impulsa la ola actual de aplicaciones de IA generativa.
Los modelos de base abarcan varias arquitecturas, cada una diseñada con fortalezas y aplicaciones únicas. Estos son algunos tipos notables:
Los modelos de base se entrenan con grandes conjuntos de datos usando aprendizaje autosupervisado, que es un enfoque en el aprendizaje automático que aprovecha las técnicas de aprendizaje no supervisado para tareas que tradicionalmente requieren aprendizaje supervisado (por ejemplo, etiquetar datos con entrada humana). Esto ayuda a entrenar el modelo para predecir partes enmascaradas o faltantes de los datos de entrada. A medida que el modelo hace predicciones, aprende a identificar patrones, relaciones y estructuras subyacentes en los datos.
El proceso de entrenamiento de un modelo de base es similar al de un modelo de aprendizaje automático y, por lo general, implica varios pasos clave:
Los modelos de base ofrecen varias ventajas potenciales para las empresas y los desarrolladores:
Versatilidad
Los modelos de base se pueden adaptar a una amplia variedad de tareas, lo que elimina la necesidad de entrenar modelos separados para cada aplicación específica. Esta adaptabilidad los hace valiosos en diversas industrias y casos de uso.
Eficiencia
El uso de modelos de base previamente entrenados puede reducir significativamente el tiempo y los recursos necesarios para desarrollar nuevas aplicaciones de IA. Ajustar un modelo previamente entrenado suele ser más rápido y eficiente que entrenar un modelo desde cero.
Exactitud
Debido a su amplio entrenamiento en grandes conjuntos de datos, los modelos de base pueden lograr una alta exactitud en diversas tareas, superando a los modelos entrenados en conjuntos de datos más pequeños.
Rentabilidad
Al reducir la necesidad de grandes cantidades de datos de entrenamiento y recursos computacionales, los modelos de base pueden ofrecer una solución rentable para desarrollar aplicaciones de IA.
Innovación
Los modelos de base están ayudando a impulsar la innovación en el campo de la IA, lo que permite el desarrollo de aplicaciones de IA nuevas y más sofisticadas.
Escalabilidad
Los modelos de base se pueden escalar para manejar grandes conjuntos de datos y tareas complejas, lo que los hace adecuados para aplicaciones exigentes.
A pesar de sus beneficios notables, los modelos de base presentan desafíos significativos que los usuarios y desarrolladores deben superar:
El ecosistema de modelos de base es dinámico y competitivo. Estos son algunos de los ejemplos más influyentes de los principales agentes de la industria:
Google Cloud proporciona una plataforma empresarial de extremo a extremo, Vertex AI, diseñada para ayudar a las organizaciones a acceder, personalizar e implementar modelos de base para aplicaciones del mundo real. La estrategia se basa en ofrecer opciones, herramientas potentes y una infraestructura integrada.
Así es como Google Cloud usa los modelos de base:
Comienza a desarrollar en Google Cloud con el crédito gratis de $300 y los más de 20 productos del nivel Siempre gratuito.