Descripción general de Model Armor

Model Armor es un servicio Google Cloud completamente administrado que mejora la seguridad de las aplicaciones de IA a través de la detección de instrucciones y respuestas de LLM para varios riesgos de seguridad. Model Armor ofrece una serie de funciones, incluidas las siguientes:

  • Independiente del modelo y de la nube: Model Armor está diseñado para admitir cualquier modelo en cualquier plataforma de nube. Esto incluye situaciones de varios modelos y varias nubes para elegir las mejores soluciones de IA para tus necesidades específicas.
  • Administración y aplicación centralizadas: Model Armor habilita la administración y aplicación centralizadas de las políticas de seguridad y protección.
  • APIs de REST públicas: Model Armor proporciona una API de REST pública que te permite integrar la detección de instrucciones y respuestas directamente en tus aplicaciones. Este enfoque basado en la API admite varias situaciones de implementación.
  • Control de acceso basado en roles (RBAC): Model Armor incorpora el control de acceso basado en roles (RBAC) para administrar el acceso y los permisos dentro del servicio, de modo que los diferentes roles de usuario tengan niveles adecuados de control y visibilidad.
  • Extremos regionales: La API de Model Armor se expone con extremos regionales, lo que proporciona una latencia baja.
  • Varias regiones: Se puede acceder a Model Armor en varias regiones de Estados Unidos y Europa.
  • Integración en Security Command Center: Model Armor está integrado en Security Command Center, por lo que puedes ver los resultados en el panel de Security Command Center, identificar incumplimientos y corregirlos desde la fuente.
  • Funciones de seguridad:
    • Filtros de seguridad y IA responsable: Model Armor ofrece filtros para la seguridad del contenido, que abordan preocupaciones como el contenido sexual explícito, peligroso, de acoso y de incitación al odio o a la violencia.
    • Detección de inyección de instrucciones y jailbreak: La armadura de modelos incluye funciones para detectar y evitar ataques de inyección de instrucciones y jailbreak.
    • Prevención de la pérdida de datos (DLP) con la protección de datos sensibles: Model Armor incluye todas las funciones del servicio de protección de datos sensibles de Google Cloud para proporcionar capacidades de prevención de la pérdida de datos. Puede descubrir, clasificar y proteger datos sensibles (p.ej., propiedad intelectual, como código fuente o información de identificación personal, como números de tarjetas de crédito), lo que evita su exposición no autorizada en las interacciones de LLM.
    • Detección de URLs maliciosas: La armadura de modelos puede identificar URLs maliciosas en las instrucciones y las respuestas, lo que mejora la postura de seguridad de las aplicaciones de IA.
    • Compatibilidad con la detección de archivos PDF: Media Armor admite la detección de texto en archivos PDF en busca de contenido malicioso.

Beneficios

Model Armor ofrece varios beneficios para las organizaciones, entre los que se incluyen los siguientes:

  • Mayor seguridad de la IA: Model Armor ayuda a las organizaciones a mitigar los riesgos de seguridad asociados con el uso de LLM. Aborda inquietudes como la inyección de instrucciones y los intentos de jailbreak, la generación de contenido dañino, las URLs maliciosas y la pérdida de datos sensibles, lo que permite integraciones seguras y confiables de los LLM en productos y servicios.
  • Visibilidad y control centralizados: Model Armor ofrece una administración centralizada en todas las aplicaciones de LLM, lo que permite a los CISO y a los arquitectos de seguridad supervisar y controlar las políticas de seguridad.
  • Opciones de implementación flexibles: Model Armor admite situaciones de varias nubes, varios modelos y varios LLM, y se puede implementar en diferentes puntos de la arquitectura de la aplicación de LLM, lo que proporciona flexibilidad para que las organizaciones la integren en su infraestructura y flujos de trabajo existentes.
  • Personalización e integración: Model Armor permite la personalización de políticas para adaptarse a casos de uso específicos de la aplicación y se integra en los flujos de trabajo operativos existentes, lo que satisface las necesidades de los CTO o desarrolladores y de los CISO o arquitectos de seguridad.

Arquitectura

Arquitectura de Model Armor

En este diagrama de arquitectura, se muestra una aplicación que usa Model Armor para proteger un LLM y un usuario. En los siguientes pasos, se explica el flujo de datos.

  1. Un usuario proporciona una instrucción a la aplicación.
  2. Model Armor inspecciona la instrucción entrante en busca de contenido potencialmente sensible.
  3. La instrucción (o instrucción limpia) se envía al LLM.
  4. El LLM genera una respuesta.
  5. Model Armor inspecciona la respuesta generada en busca de contenido potencialmente sensible.
  6. La respuesta (o la respuesta limpia) se envía al usuario. Model Armor envía una descripción detallada de los filtros activados y no activados en la respuesta.

En resumen, Model Armor actúa como un filtro que inspecciona la entrada (instrucción) y la salida (respuesta) para garantizar que el LLM no esté expuesto ni proporcione entradas o salidas maliciosas o sensibles.

Casos de uso

Estos son algunos ejemplos de casos de uso de Model Armor en varios sectores:

  • Seguridad

    • Las organizaciones pueden mitigar el riesgo de que se filtren información de identificación personal (PII) y propiedad intelectual (PI) sensible en las instrucciones o respuestas de los LLM.
    • Las organizaciones pueden protegerse contra los ataques de inyección de instrucciones y jailbreak, lo que evita que los actores maliciosos manipulen los sistemas de IA para realizar acciones no deseadas.
    • Las organizaciones pueden analizar el texto de los archivos PDF en busca de contenido sensible o malicioso.
  • Seguridad y IA responsable

    • Las organizaciones pueden evitar que su chatbot recomiende soluciones de la competencia, lo que mantiene la integridad de la marca y la lealtad de los clientes.
    • Las organizaciones pueden filtrar las publicaciones en redes sociales que genera su IA y que contienen mensajes dañinos, como contenido peligroso o que incita al odio.

Extremos regionales

Model Armor es un producto regional, y la API se expone a través de extremos regionales. Se admiten los siguientes extremos regionales:

  • Estados Unidos

    • Iowa (región us-central1): modelarmor.us-central1.rep.googleapis.com

    • Virginia del Norte (región us-east4): modelarmor.us-east4.rep.googleapis.com

    • Oregón (región us-west1): modelarmor.us-west1.rep.googleapis.com

  • Europa

    • Países Bajos (región europe-west4): modelarmor.europe-west4.rep.googleapis.com

Precios

Model Armor se puede comprar como parte integrada de Security Command Center o como servicio independiente. Consulta los precios de Security Command Center para conocer los precios de Security Command Center y las opciones independientes.

Consideraciones

Cuando uses Model Armor, ten en cuenta lo siguiente:

  • El filtro de detección de jailbreak y de inyección de instrucciones admite hasta 512 tokens, y el resto de los filtros admite hasta 2,000 tokens.
  • La configuración de límite no puede aplicar la protección de datos sensibles.
  • Model Armor admite los formatos de texto y PDF. En los archivos PDF, Model Armor solo analiza el contenido textual.

¿Qué sigue?