Elige una función de procesamiento de documentos
En este documento, se proporciona una comparación de las funciones de procesamiento de documentos disponibles en BigQuery ML, que son ML.GENERATE_TEXT
y ML.PROCESS_DOCUMENT
.
Puedes usar la información de este documento para decidir qué función usar en los casos en que las funciones tengan capacidades superpuestas.
En términos generales, la diferencia entre estas funciones es la siguiente:
ML.GENERATE_TEXT
es una buena opción para realizar tareas de procesamiento de lenguaje natural (PLN) en las que parte del contenido reside en documentos. Esta función ofrece los siguientes beneficios:- Bajar los costos
- Compatibilidad con más idiomas
- Mayor rendimiento
- Capacidad de ajuste de modelos
- Disponibilidad de modelos multimodales
Para ver ejemplos de tareas de procesamiento de documentos que funcionan mejor con este enfoque, consulta Explora las capacidades de procesamiento de documentos con la API de Gemini.
ML.PROCESS_DOCUMENT
es una buena opción para realizar tareas de procesamiento de documentos que requieren el análisis de documentos y una respuesta estructurada predefinida.
Modelos compatibles
Los modelos compatibles son los siguientes:
ML.GENERATE_TEXT
: Puedes usar un subconjunto de los modelos de Gemini de Vertex AI para generar texto. Para obtener más información sobre los modelos compatibles, consulta la sintaxis deML.GENERATE_TEXT
.ML.PROCESS_DOCUMENT
: Usas el modelo predeterminado de la API de Document AI. El uso de la API de Document AI te brinda acceso a muchos procesadores de documentos diferentes, como el analizador de facturas, el analizador de diseño y el analizador de formularios. Puedes usar estos procesadores de documentos para trabajar con archivos PDF con muchas estructuras diferentes.
Tareas admitidas
Las tareas admitidas son las siguientes:
ML.GENERATE_TEXT
: Puedes realizar cualquier tarea de PLN en la que la entrada sea un documento. Por ejemplo, si tienes un documento financiero de una empresa, puedes recuperar la información del documento proporcionando una instrucción comoWhat is the quarterly revenue for each division?
.ML.PROCESS_DOCUMENT
: Puedes realizar un procesamiento de documentos especializado para diferentes tipos de documentos, como facturas, formularios fiscales y estados financieros. También puedes dividir documentos. Para obtener más información sobre cómo usar la funciónML.PROCESS_DOCUMENT
para esta tarea, consulta Cómo analizar archivos PDF en una canalización de generación con recuperación mejorada.
Precios
Los precios se calculan de la siguiente manera:
ML.GENERATE_TEXT
: Para conocer los precios de los modelos de Vertex AI que usas con esta función, consulta Precios de Vertex AI. El ajuste supervisado de los modelos compatibles se cobra en dólares por hora de procesamiento de nodo. Para obtener más información, consulta los precios del entrenamiento personalizado de Vertex AI.ML.PROCESS_DOCUMENT
: Para conocer los precios del servicio de Cloud AI que usas con esta función, consulta Precios de la API de Document AI.
Ajuste supervisado
La compatibilidad con la optimización supervisada es la siguiente:
ML.GENERATE_TEXT
: El ajuste supervisado es compatible con algunos modelos.ML.PROCESS_DOCUMENT
: No se admite el ajuste supervisado.
Límite de consultas por minuto (QPM)
Los límites de QPM son los siguientes:
ML.GENERATE_TEXT
: 60 QPM en la región predeterminada deus-central1
para los modelosgemini-1.5-pro
y 200 QPM en la región predeterminada deus-central1
para los modelosgemini-1.5-flash
Para obtener más información, consulta cuotas de IA generativa en Vertex AI.ML.PROCESS_DOCUMENT
: 120 QPM por tipo de procesador, con un límite general de 600 QPM por proyecto. Para obtener más información, consulta la lista de cuotas.
Para aumentar tu cuota, consulta Solicita una cuota más alta.
Límite de tokens
Los límites de tokens son los siguientes:
ML.GENERATE_TEXT
: 700 tokens de entrada y 8, 196 tokens de salida.ML.PROCESS_DOCUMENT
: Sin límite de tokens. Sin embargo, esta función tiene diferentes límites de páginas según el procesador que uses. Para obtener más información, consulta Límites.
Lenguajes compatibles
Los lenguajes admitidos son los siguientes:
ML.GENERATE_TEXT
: Admite los mismos idiomas que Gemini.ML.PROCESS_DOCUMENT
: La compatibilidad con idiomas depende del tipo de procesador de documentos. La mayoría solo admite inglés. Para obtener más información, consulta la lista de procesadores.
Disponibilidad por región
La disponibilidad por región es la siguiente:
ML.GENERATE_TEXT
: disponible en todas las regiones de IA generativa para Vertex AI.ML.PROCESS_DOCUMENT
: Disponible en las multirregionesEU
yUS
para todos los procesadores. Algunos procesadores también están disponibles en ciertas regiones únicas. Para obtener más información, consulta Asistencia regional y multirregional.