Modelos de Qwen

Los modelos Qwen en Vertex AI ofrecen modelos completamente administrados y sin servidores como APIs. Para usar un modelo de Qwen en Vertex AI, envía una solicitud directamente al extremo de API de Vertex AI. Debido a que los modelos de Qwen usan una API administrada, no es necesario aprovisionar ni administrar la infraestructura.

Puedes transmitir tus respuestas para reducir la percepción de latencia del usuario final. Una respuesta transmitida usa eventos enviados por el servidor (SSE) para transmitir la respuesta de forma incremental.

Modelos de Qwen disponibles

Los siguientes modelos están disponibles de Qwen para usarlos en Vertex AI. Para acceder a un modelo de Qwen, ve a su tarjeta de modelo de Model Garden.

Qwen3-Next-80B Instruct

Qwen3-Next-80B Instruct es un modelo de lenguaje de la familia de modelos Qwen3-Next. Está diseñado para seguir comandos específicos y manejar textos muy largos. Utiliza un diseño inteligente llamado Mixture-of-Experts (MoE), que activa un subconjunto de parámetros disponibles para procesar información, lo que hace que su ejecución sea más rápida y rentable que la de otros modelos de su tamaño.

La versión Instruct está optimizada para brindar respuestas confiables y directas en aplicaciones de chat y de agentes, y su gran ventana de contexto le permite mantener en la memoria una conversación completa o un documento extenso.

Ir a la tarjeta de modelo de Qwen3-Next-80B Instruct

Qwen3-Next-80B Thinking

Qwen3-Next-80B Thinking es un modelo de lenguaje de la familia de modelos Qwen3-Next. Está especializado en la resolución de problemas complejos y el razonamiento profundo. Su modo de "pensamiento" genera un proceso de razonamiento visible paso a paso junto con la respuesta final, lo que lo hace ideal para tareas que requieren lógica transparente, como pruebas matemáticas, depuración de código intrincado o planificación de agentes de varios pasos.

Ir a la tarjeta de modelo de Qwen3-Next-80B Thinking

Qwen3 Coder (Qwen3 Coder)

Qwen3 Coder (Qwen3 Coder) es un modelo de gran escala y de código abierto desarrollado para tareas avanzadas de desarrollo de software. La característica clave del modelo es su gran ventana de contexto, que le permite procesar y comprender grandes bases de código de manera integral.

Ir a la tarjeta de modelo de Qwen3 Coder

Qwen3 235B (Qwen3 235B)

Qwen3 235B (Qwen3 235B) es un modelo grande con 235 mil millones de parámetros. El modelo se distingue por su capacidad de "pensamiento híbrido", que permite a los usuarios cambiar de forma dinámica entre un modo de "pensamiento" metódico y paso a paso para tareas complejas, como el razonamiento matemático y la programación, y un modo rápido de "no pensamiento" para conversaciones de uso general. Su gran ventana de contexto lo hace adecuado para casos de uso que requieren un razonamiento profundo y comprensión de formato largo.

Ir a la tarjeta de modelo de Qwen3 235B

Antes de comenzar

Para usar los modelos de Qwen con Vertex AI, debes realizar los siguientes pasos. La API de Vertex AI (aiplatform.googleapis.com) debe estar habilitada para usar Vertex AI. Si ya tienes un proyecto existente con la API de Vertex AI habilitada, puedes usar ese proyecto en lugar de crear uno nuevo.

  1. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  2. Verify that billing is enabled for your Google Cloud project.

  3. Enable the Vertex AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  4. Ve a una de las siguientes tarjetas de modelo de Model Garden y, luego, haz clic en Habilitar.