Desde el 29 de abril del 2025, los modelos Gemini 1.5 Pro y Gemini 1.5 Flash no están disponibles en proyectos donde no se hayan utilizado previamente, incluidos los proyectos nuevos. Para obtener más información, consulta Versiones y ciclo de vida de los modelos.

Esta página se ha traducido con Cloud Translation API.

API MedLM

Aviso: MedLM en Vertex AI está disponible de forma general en Brasil, Estados Unidos y Singapur para un grupo limitado de clientes, y en vista previa para un grupo limitado de clientes de fuera de Estados Unidos. Esta versión se centra en el uso de las funciones de preguntas y respuestas y de resúmenes médicos. Al usar la API MedLM, aceptas la Política de Usos Prohibidos de la IA Generativa y los Términos Específicos del Servicio de Google Cloud Platform, y te comprometes a informar y coordinarte con Google de buena fe para responder a cualquier consulta de las autoridades competentes en relación con tu uso de MedLM. En este producto, puede tratar datos personales tal como se indica en los Términos de Seguridad y Tratamiento de Datos, de acuerdo con las restricciones descritas en los Términos del Servicio de Google Cloud Platform. Para obtener más información, consulta las descripciones de las fases de lanzamiento. Siempre que celebres un Contrato de Colaboración Empresarial con Google que cubra tu uso de los Servicios de Google Cloud Platform, la API MedLM se puede usar para tratar información médica protegida sujeta a la ley de transferencia y responsabilidad de los seguros médicos de EE. UU. (Health Insurance Portability and Accountability Act, HIPAA) de 1996 o a cualquier modificación o normativa de la HIPAA.

Precaución:

Antes de activar el uso en producción de MedLM, los clientes deben ponerse en contacto con el equipo de producto de Google para hablar sobre el uso.
MedLM no se ha diseñado ni desarrollado para usarse como dispositivo médico. Un profesional sanitario debe verificar los resultados y no se debe afirmar que se trata de un diagnóstico directo.
Los resultados generados no siempre son completamente fiables. Debido a la naturaleza de los LLMs y la IA generativa, los resultados pueden contener información incorrecta o sesgada (por ejemplo, estereotipos u otro contenido perjudicial) y deben revisarse. Todos los resúmenes o respuestas deben considerarse borradores y no definitivos.
Si Vertex AI detecta contenido que infringe nuestras políticas, incluidas la Política de Uso Aceptable de Google Cloud Platform y la Política de Usos Prohibidos de la IA Generativa, no se devuelve ninguna respuesta.
Cuando los profesionales sanitarios usan MedLM para responder preguntas, solo se debe utilizar como herramienta educativa para la formación médica o para reforzar la formación previa de los profesionales sanitarios.
Es posible que el resultado del LLM no siga el formato exacto indicado en la petición. El diseño de la petición para extraer información de cada campo debe tener en cuenta que el formato puede desviarse del original (por ejemplo, guiones en los nombres de los campos o uso exacto de mayúsculas y minúsculas).

MedLM es una familia de modelos básicos optimizados para el sector sanitario. Med-PaLM 2 es uno de los modelos basados en texto desarrollados por Google Research que impulsa MedLM. Fue el primer sistema de IA en alcanzar el nivel de un experto humano a la hora de responder preguntas similares a las del examen de licencia médica de Estados Unidos (USMLE). El desarrollo de estos modelos se ha basado en las necesidades específicas de los clientes, como responder a preguntas médicas y redactar resúmenes.

Tarjeta de modelo de MedLM

La tarjeta de modelo de MedLM describe los detalles del modelo, como el uso previsto de MedLM, un resumen de los datos y la información de seguridad. Haz clic en el siguiente enlace para descargar una versión PDF de la tarjeta del modelo MedLM:

Descargar la tarjeta de modelo de MedLM

Casos prácticos

Respuesta a preguntas: proporciona borradores de respuestas a preguntas relacionadas con la medicina en formato de texto.
Resumen: redacta una versión más breve de un documento (como un resumen posterior a la visita o una nota sobre el historial y la exploración física) que incluya información pertinente del texto original.

Para obtener más información sobre cómo diseñar peticiones de texto, consulta Descripción general de las estrategias de peticiones.

Solicitud HTTP

MedLM-medium (medlm-medium):

POST https://us-central1-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/us-central1/publishers/google/models/medlm-medium:predict

MedLM-large (medlm-large):

POST https://us-central1-aiplatform.googleapis.com/v1/projects/{PROJECT_ID}/locations/us-central1/publishers/google/models/medlm-large:predict

Consulta el método predict para obtener más información.

Versiones del modelo

MedLM proporciona los siguientes modelos:

MedLM-medium (medlm-medium)
MedLM-large (medlm-large)

En la siguiente tabla se muestran las versiones estables del modelo disponibles:

Modelo medlm-medium	Fecha de lanzamiento
`medlm-medium`	13 de diciembre del 2023

Modelo medlm-large	Fecha de lanzamiento
`medlm-large`	13 de diciembre del 2023

MedLM-medium y MedLM-large tienen endpoints independientes y ofrecen a los clientes más flexibilidad para sus casos prácticos. MedLM-medium ofrece a los clientes mejores rendimientos e incluye datos más recientes. MedLM-large es el mismo modelo que en la fase de vista previa. Ambos modelos seguirán actualizándose durante el ciclo de vida del producto. En esta página, "MedLM" hace referencia a ambos modelos.

Para obtener más información, consulta Versiones y ciclo de vida de los modelos.

Filtros de seguridad y atributos de MedLM

El contenido procesado a través de la API MedLM se evalúa en función de una lista de atributos de seguridad, que incluye categorías dañinas y temas que pueden considerarse sensibles. Si ves una respuesta alternativa, como "No puedo ayudarte con eso, ya que solo soy un modelo de lenguaje", significa que la petición o la respuesta activan un filtro de seguridad.

Umbrales de seguridad

Cuando usas Vertex AI Studio, puedes usar un umbral de filtro de seguridad ajustable para determinar la probabilidad de que veas respuestas que puedan ser perjudiciales. Las respuestas del modelo se bloquean en función de la probabilidad de que contengan acoso, incitación al odio, contenido peligroso o contenido sexual explícito. El ajuste del filtro de seguridad se encuentra en la parte derecha del campo de petición de Vertex AI Studio. Puedes elegir entre tres opciones: block most, block some y block few.

Console-image

Probar los umbrales de confianza y gravedad

Puedes probar los filtros de seguridad de Google y definir los umbrales de confianza que mejor se adapten a tu empresa. Al usar estos umbrales, puede tomar medidas integrales para detectar contenido que infrinja las políticas de uso o los términos del servicio de Google y tomar las medidas oportunas.

Las puntuaciones de confianza son solo predicciones, por lo que no debes depender de ellas para determinar la fiabilidad o la precisión. Google no se hace responsable de interpretar ni de usar estas puntuaciones para tomar decisiones empresariales.

Prácticas recomendadas

Para utilizar esta tecnología de forma segura y responsable, es importante tener en cuenta otros riesgos específicos de tu caso de uso, tus usuarios y tu contexto empresarial, además de las medidas de protección técnicas integradas.

Cuerpo de la solicitud

{
  "instances": [
    {
      "content": string
    }
  ],
  "parameters": {
    "temperature": number,
    "maxOutputTokens": integer,
    "topK": integer,
    "topP": number
  }
}

Usa los siguientes parámetros para los modelos medlm-medium y medlm-large. Para obtener más información, consulta Diseñar peticiones de texto.

Parámetro	Descripción	Valores aceptables
`content`	Entrada de texto para generar la respuesta del modelo. Las peticiones pueden incluir preámbulos, preguntas, sugerencias, instrucciones o ejemplos.	Texto
`temperature`	La temperatura se usa para el muestreo durante la generación de respuestas, que se produce cuando se aplican `topP` y `topK`. La temperatura controla el grado de aleatoriedad en la selección de tokens. Las temperaturas más bajas son adecuadas para las peticiones que requieren una respuesta menos abierta o creativa, mientras que las temperaturas más altas pueden dar lugar a resultados más diversos o creativos. Una temperatura de `0` significa que siempre se seleccionan los tokens con la probabilidad más alta. En este caso, las respuestas a una petición determinada son mayormente deterministas, pero sigue siendo posible que haya una pequeña variación. Si el modelo devuelve una respuesta demasiado genérica o demasiado corta, o bien una respuesta alternativa, prueba a aumentar la temperatura.	`0.0–1.0` `Default: 0.2`
`maxOutputTokens`	Número máximo de tokens que se pueden generar en la respuesta. Un token tiene aproximadamente cuatro caracteres. 100 tokens corresponden aproximadamente a entre 60 y 80 palabras. Especifica un valor inferior para las respuestas más cortas y un valor superior para las respuestas que puedan ser más largas.	`1–8192` para medlm-medium `1–1024` para medlm-large
`topK`	Top-K cambia la forma en que el modelo selecciona los tokens de salida. Un valor de K superior de `1` significa que el siguiente token seleccionado es el más probable de todos los tokens del vocabulario del modelo (también llamado decodificación voraz), mientras que un valor de K superior de `3` significa que el siguiente token se selecciona de entre los tres tokens más probables mediante la temperatura. En cada paso de selección de tokens, se muestrean los K tokens principales con las probabilidades más altas. Después, los tokens se filtran en función de la probabilidad P máxima y el token final se selecciona mediante un muestreo de temperatura. Especifica un valor más bajo para obtener respuestas menos aleatorias y un valor más alto para obtener respuestas más aleatorias.	`1–40` `Default: 40`
`topP`	Top-P cambia la forma en que el modelo selecciona los tokens de salida. Los tokens se seleccionan de más probable a menos probable hasta que la suma de sus probabilidades sea igual al valor de top-P. Por ejemplo, si los tokens A, B y C tienen una probabilidad de 0,3, 0,2 y 0,1, y el valor de top_p es `0.5`, el modelo seleccionará A o B como el siguiente token usando la temperatura y excluirá C como candidato. Especifica un valor más bajo para obtener respuestas menos aleatorias y un valor más alto para obtener respuestas más aleatorias.	`0.0–1.0` `Default: 0.8`

Solicitud de ejemplo

Cuando se usa la API MedLM, es importante incorporar la ingeniería de peticiones. Por ejemplo, te recomendamos que proporciones instrucciones adecuadas y específicas para cada tarea al principio de cada petición. Para obtener más información, consulta Introducción a las peticiones.

REST

Antes de usar los datos de la solicitud, haz las siguientes sustituciones:

PROJECT_ID: tu ID de proyecto.
MEDLM_MODEL: el modelo de MedLM, medlm-medium o medlm-large.

Método HTTP y URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MEDLM_MODEL:predict

Cuerpo JSON de la solicitud:

{
  "instances": [
    {
      "content": "Question: What causes you to get ringworm?"
    }
  ],
  "parameters": {
    "temperature": 0,
    "maxOutputTokens": 256,
    "topK": 40,
    "topP": 0.95
  }
}

Para enviar tu solicitud, elige una de estas opciones:

curl

Nota: En el siguiente comando se presupone que has iniciado sesión en la CLI de gcloud con tu cuenta de usuario ejecutando gcloud init o gcloud auth login , o bien usando Cloud Shell, que inicia sesión automáticamente en la CLI de gcloud . Para comprobar qué cuenta está activa, ejecuta gcloud auth list.

Guarda el cuerpo de la solicitud en un archivo llamado request.json. Ejecuta el siguiente comando en el terminal para crear o sobrescribir este archivo en el directorio actual:

cat > request.json << 'EOF'
{
  "instances": [
    {
      "content": "Question: What causes you to get ringworm?"
    }
  ],
  "parameters": {
    "temperature": 0,
    "maxOutputTokens": 256,
    "topK": 40,
    "topP": 0.95
  }
}
EOF

A continuación, ejecuta el siguiente comando para enviar tu solicitud REST:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MEDLM_MODEL:predict"

PowerShell

Nota: El siguiente comando presupone que has iniciado sesión en la CLI de gcloud con tu cuenta de usuario ejecutando gcloud init o gcloud auth login . Para comprobar qué cuenta está activa, ejecuta gcloud auth list.