Modelos Llama en Vertex AI de Google Cloud
Implementa modelos Llama (de la empresa de tecnología Meta) en Vertex AI para crear agentes y aplicaciones de IA listos para producción. Con una variedad de tamaños y capacidades de modelos, puedes elegir el modelo de Llama adecuado para tu caso de uso específico, desde modelos ligeros y eficientes hasta versiones multimodales. Accede a estos modelos como APIs sin servidores y aprovecha sus capacidades multimodales y multilingües nativas para una inteligencia visual y de texto altamente eficiente.
Los modelos de lenguaje grandes (LLM) de código abierto de Llama proporcionan a los desarrolladores la transparencia y la flexibilidad necesarias para la innovación, lo que permite una implementación sencilla, rentabilidad y rendimiento escalable. Cuando compilas con Llama en Vertex AI, combinas las ventajas de los modelos abiertos de vanguardia con la seguridad, la escalabilidad y las herramientas administradas de nivel empresarial de la plataforma de IA integral de Google Cloud.
LLM de acceso abierto, diseñados para escalar
Llama 4 Maverick, con 17,000 millones de parámetros activos, es un modelo multimodal entrenado por 128 expertos que ofrece un equilibrio óptimo entre inteligencia, costo y velocidad. Llama 4 Maverick ofrece comprensión de imágenes y texto, lo que permite la creación de aplicaciones de IA sofisticadas que superan las barreras lingüísticas. Los modelos de Llama 4 ofrecen capacidades de programación, razonamiento y procesamiento de imágenes, y cuentan con una arquitectura de redes neuronales de mezcla de expertos (MoE).
Entre los principales casos de uso, se incluyen la traducción de idiomas, el resumen de varios documentos y la creación de contenido. También puede brindar asistencia personal, apoyar la educación y el aprendizaje, ayudar en la investigación y razonar sobre grandes bases de código.
Llama 4 Scout: un modelo multimodal nativo líder en su clase
Llama 4 Scout es un modelo de IA multimodal potente con un rendimiento sólido en tareas muy complejas. Puede navegar por instrucciones abiertas y situaciones nunca antes vistas con fluidez.
Los casos de uso principales incluyen apps de asistente multimodal, como la creación de chatbots con imágenes y texto, la depuración de tareas de generación de código, aplicaciones de contexto largo, flujos de trabajo de varios agentes y toma de decisiones basada en datos.
Llama 3.3 70B: Modelo de IA de código abierto
Llama 3.3 70B es un modelo de solo texto que se puede implementar a través de la plataforma de Vertex AI y que está altamente optimizado para el rendimiento y la eficiencia en el manejo de una amplia gama de tareas basadas en el lenguaje, lo que les da a los desarrolladores una aplicación liviana que reduce los costos.
Los casos de uso principales incluyen la implementación en atención al cliente, la generación y depuración de código y los datos de entrenamiento.
Llama 3.2 90B: un modelo multimodal ligero
Llama 3.2 90B, un modelo multimodal, eficiente y flexible que puede comprender imágenes de alta resolución.
Los principales casos de uso incluyen la funcionalidad de búsqueda visual que permite a los usuarios encontrar productos con imágenes, como comercio electrónico, escaneos médicos, análisis de datos para documentos complejos, generación de contenido y reconocimiento del contexto.
LLM de acceso abierto, diseñados para escalar
Llama 4 Maverick, con 17,000 millones de parámetros activos, es un modelo multimodal entrenado por 128 expertos que ofrece un equilibrio óptimo entre inteligencia, costo y velocidad. Llama 4 Maverick ofrece comprensión de imágenes y texto, lo que permite la creación de aplicaciones de IA sofisticadas que superan las barreras lingüísticas. Los modelos de Llama 4 ofrecen capacidades de programación, razonamiento y procesamiento de imágenes, y cuentan con una arquitectura de redes neuronales de mezcla de expertos (MoE).
Entre los principales casos de uso, se incluyen la traducción de idiomas, el resumen de varios documentos y la creación de contenido. También puede brindar asistencia personal, apoyar la educación y el aprendizaje, ayudar en la investigación y razonar sobre grandes bases de código.
Llama 4 Scout: un modelo multimodal nativo líder en su clase
Llama 4 Scout es un modelo de IA multimodal potente con un rendimiento sólido en tareas muy complejas. Puede navegar por instrucciones abiertas y situaciones nunca antes vistas con fluidez.
Los casos de uso principales incluyen apps de asistente multimodal, como la creación de chatbots con imágenes y texto, la depuración de tareas de generación de código, aplicaciones de contexto largo, flujos de trabajo de varios agentes y toma de decisiones basada en datos.
Llama 3.3 70B: Modelo de IA de código abierto
Llama 3.3 70B es un modelo de solo texto que se puede implementar a través de la plataforma de Vertex AI y que está altamente optimizado para el rendimiento y la eficiencia en el manejo de una amplia gama de tareas basadas en el lenguaje, lo que les da a los desarrolladores una aplicación liviana que reduce los costos.
Los casos de uso principales incluyen la implementación en atención al cliente, la generación y depuración de código y los datos de entrenamiento.
Llama 3.2 90B: un modelo multimodal ligero
Llama 3.2 90B, un modelo multimodal, eficiente y flexible que puede comprender imágenes de alta resolución.
Los principales casos de uso incluyen la funcionalidad de búsqueda visual que permite a los usuarios encontrar productos con imágenes, como comercio electrónico, escaneos médicos, análisis de datos para documentos complejos, generación de contenido y reconocimiento del contexto.
Vertex AI proporciona un entorno integrado para evaluar, implementar y administrar aplicaciones habilitadas para Llama rápidamente y a gran escala.
Simplifica la forma en que implementas y escalas modelos de Llama con una infraestructura completamente administrada diseñada para cargas de trabajo de IA y la opción de seleccionar entre modelos de precios flexibles, como extremos dedicados o precios de pago por uso.
Desarrolla agentes con las herramientas de Vertex AI y las capacidades avanzadas de los modelos Llama.
Aprovecha las funciones integradas de seguridad, privacidad, administración de datos y cumplimiento de Google Cloud que se diseñaron para cumplir con los estándares de nivel empresarial.
Integra los datos de tu empresa en las capacidades avanzadas de Llama y aprovecha herramientas como BigQuery para extraer estadísticas valiosas y fomentar una toma de decisiones fundamentada.
Los modelos Llama demuestran habilidades avanzadas en razonamiento complejo, análisis de visión, generación de código y procesamiento multilingüe. Estos modelos pueden seguir instrucciones complejas y generar resultados integrales y con matices.