Modelos Llama en Vertex AI de Google Cloud
Despliega modelos Llama (de la empresa tecnológica Meta) en Vertex AI para crear agentes y aplicaciones de IA listos para la producción. Con una variedad de tamaños y capacidades de modelos, puedes elegir el modelo de Llama adecuado para tu caso práctico específico, desde modelos ligeros y eficientes hasta versiones multimodales. Accede a estos modelos como APIs sin servidor y aprovecha sus capacidades multimodales y multilingües nativas para obtener inteligencia visual y de texto de alta eficiencia.
Los modelos de lenguaje extenso (LLMs) de código abierto de Llama ofrecen a los desarrolladores la transparencia y la flexibilidad necesarias para innovar, lo que permite una implementación sencilla, rentabilidad y un rendimiento escalable. Si desarrollas con Llama en Vertex AI, podrás combinar las ventajas de los modelos abiertos de vanguardia con la seguridad, la escalabilidad y las herramientas gestionadas de nivel empresarial de la completa plataforma de IA de Google Cloud.
LLMs de acceso abierto y diseñados para escalar
Llama 4 Maverick, con 17.000 millones de parámetros activos, es un modelo multimodal entrenado con 128 expertos que ofrece un equilibrio óptimo entre inteligencia, coste y velocidad. Llama 4 Maverick ofrece comprensión de imágenes y texto, lo que permite crear aplicaciones de IA sofisticadas que superan las barreras lingüísticas. Los modelos de Llama 4 ofrecen funciones de programación, razonamiento e imagen, y cuentan con una arquitectura de redes neuronales de Mixture-of-Experts (MoE).
Algunos de los principales casos prácticos son la traducción de idiomas, el resumen de varios documentos y la creación de contenido. También puede ofrecer asistencia personal, apoyar la educación y el aprendizaje, ayudar en la investigación y razonar sobre grandes bases de código.
Llama 4 Scout: un modelo multimodal nativo líder en su clase
Llama 4 Scout es un modelo de IA multimodal potente que ofrece un rendimiento excelente en tareas muy complejas. Puede abordar peticiones abiertas y situaciones que no se ven, con fluidez.
Entre los principales casos prácticos se incluyen aplicaciones de asistentes multimodales, como la creación de bots de chat con texto e imágenes, la depuración de tareas de generación de código, las aplicaciones de contexto largo, los flujos de trabajo con varios agentes y la toma de decisiones basada en datos.
Llama 3.3 70B: modelo de IA de código abierto
Llama 3.3 70B es un modelo de solo texto que se puede desplegar a través de la plataforma Vertex AI y que está muy optimizado para ofrecer un alto rendimiento y eficiencia a la hora de gestionar una amplia variedad de tareas basadas en el lenguaje. De esta forma, los desarrolladores pueden usar una aplicación ligera que reduce los costes.
Algunos de los principales casos prácticos son la implementación en el servicio de atención al cliente, la generación y depuración de código y los datos de entrenamiento.
Llama 3.2 90B: un modelo multimodal ligero
Llama 3.2 90B, un modelo multimodal, eficiente y flexible que puede comprender imágenes de alta resolución.
Algunos casos prácticos son la función de búsqueda visual, que permite a los usuarios encontrar productos usando imágenes (por ejemplo, en el comercio electrónico), los escáneres médicos, el análisis de datos de documentos complejos, la generación de contenido y la capacidad de tener en cuenta el contexto.
LLMs de acceso abierto y diseñados para escalar
Llama 4 Maverick, con 17.000 millones de parámetros activos, es un modelo multimodal entrenado con 128 expertos que ofrece un equilibrio óptimo entre inteligencia, coste y velocidad. Llama 4 Maverick ofrece comprensión de imágenes y texto, lo que permite crear aplicaciones de IA sofisticadas que superan las barreras lingüísticas. Los modelos de Llama 4 ofrecen funciones de programación, razonamiento e imagen, y cuentan con una arquitectura de redes neuronales de Mixture-of-Experts (MoE).
Algunos de los principales casos prácticos son la traducción de idiomas, el resumen de varios documentos y la creación de contenido. También puede ofrecer asistencia personal, apoyar la educación y el aprendizaje, ayudar en la investigación y razonar sobre grandes bases de código.
Llama 4 Scout: un modelo multimodal nativo líder en su clase
Llama 4 Scout es un modelo de IA multimodal potente que ofrece un rendimiento excelente en tareas muy complejas. Puede abordar peticiones abiertas y situaciones que no se ven, con fluidez.
Entre los principales casos prácticos se incluyen aplicaciones de asistentes multimodales, como la creación de bots de chat con texto e imágenes, la depuración de tareas de generación de código, las aplicaciones de contexto largo, los flujos de trabajo con varios agentes y la toma de decisiones basada en datos.
Llama 3.3 70B: modelo de IA de código abierto
Llama 3.3 70B es un modelo de solo texto que se puede desplegar a través de la plataforma Vertex AI y que está muy optimizado para ofrecer un alto rendimiento y eficiencia a la hora de gestionar una amplia variedad de tareas basadas en el lenguaje. De esta forma, los desarrolladores pueden usar una aplicación ligera que reduce los costes.
Algunos de los principales casos prácticos son la implementación en el servicio de atención al cliente, la generación y depuración de código y los datos de entrenamiento.
Llama 3.2 90B: un modelo multimodal ligero
Llama 3.2 90B, un modelo multimodal, eficiente y flexible que puede comprender imágenes de alta resolución.
Algunos casos prácticos son la función de búsqueda visual, que permite a los usuarios encontrar productos usando imágenes (por ejemplo, en el comercio electrónico), los escáneres médicos, el análisis de datos de documentos complejos, la generación de contenido y la capacidad de tener en cuenta el contexto.
Vertex AI proporciona un entorno integrado para evaluar, desplegar y gestionar aplicaciones con la tecnología de Llama de forma rápida y a escala.
Simplifica la forma en que despliegas y escalas los modelos de Llama con una infraestructura totalmente gestionada diseñada para cargas de trabajo de IA y la opción de elegir entre distintos modelos de precios flexibles, como los endpoints dedicados o el de pago por uso.
Desarrolla agentes con las herramientas de Vertex AI y las funciones avanzadas de los modelos Llama.
Aprovecha las funciones integradas de seguridad, privacidad, gobierno de datos y cumplimiento de Google Cloud, que se adaptan a los estándares empresariales.
Integra los datos de tu empresa con las funciones avanzadas de Llama, que utilizan herramientas como BigQuery para extraer información valiosa y tomar decisiones fundamentadas.
Los modelos Llama demuestran habilidades avanzadas en razonamiento complejo, análisis visual, generación de código y procesamiento multilingüe. Estos modelos pueden seguir instrucciones complejas y generar resultados completos y matizados.