Evalúa el rendimiento
Document AI genera métricas de evaluación, como precisión y recuperación, para ayudarte a determinar el rendimiento predictivo de tus procesadores.
Estas métricas de evaluación se generan mediante la comparación de las entidades que muestra el procesador (las predicciones) con las anotaciones en los documentos de prueba. Si tu procesador no tiene un conjunto de prueba, primero debes crear un conjunto de datos y etiquetar los documentos de prueba.
Ejecuta una evaluación
Una evaluación se ejecuta automáticamente cada vez que entrenas o actualizas una versión del procesador.
También puedes ejecutar una evaluación de forma manual. Esto es necesario para generar métricas actualizadas después de modificar el conjunto de prueba o si estás evaluando una versión del procesador previamente entrenada.
IU web
En la consola de Google Cloud, ve a la página Procesadores y elige tu procesador.
En la pestaña Evaluar y probar, selecciona la Versión del procesador que quieres evaluar y, luego, haz clic en Ejecutar nueva evaluación.
Una vez completada, la página contiene métricas de evaluación para todas las etiquetas y para cada etiqueta individual.
Python
Para obtener más información, consulta la documentación de referencia de la API de Document AI Python.
Para autenticarte en Document AI, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Cómo obtener los resultados de una evaluación
IU web
En la consola de Google Cloud, ve a la página Procesadores y elige tu procesador.
En la pestaña Evaluar y probar, selecciona la Versión del procesador para ver la evaluación.
Una vez completada, la página contiene métricas de evaluación para todas las etiquetas y para cada etiqueta individual.
Python
Para obtener más información, consulta la documentación de referencia de la API de Document AI Python.
Para autenticarte en Document AI, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Enumera todas las evaluaciones de una versión de procesador
Python
Para obtener más información, consulta la documentación de referencia de la API de Document AI Python.
Para autenticarte en Document AI, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.
Métricas de evaluación para todas las etiquetas
Las métricas de Todas las etiquetas se calculan en función de la cantidad de verdaderos positivos, falsos positivos y falsos negativos en el conjunto de datos de todas las etiquetas y, por lo tanto, se ponderan según la cantidad de veces que aparece cada etiqueta en el conjunto de datos. Para las definiciones de estos términos, consulta Métricas de evaluación de etiquetas individuales.
Precisión: Es la proporción de predicciones que coinciden con las anotaciones del conjunto de prueba. Se define como
True Positives / (True Positives + False Positives)
.Recuperación: Es la proporción de anotaciones en el conjunto de prueba que se predicen de forma correcta. Se define como
True Positives / (True Positives + False Negatives)
.Puntuación F1: Es la media armónica de precisión y recuperación, que combina la precisión y la recuperación en una sola métrica, lo que les otorga el mismo peso a ambas. Se define como
2 * (Precision * Recall) / (Precision + Recall)
.
Métricas de evaluación para etiquetas individuales
Verdaderos positivos: Son las entidades predichas que coinciden con una anotación en el documento de prueba. Para obtener más información, consulta Comportamiento de coincidencia.
Falsos positivos: Son las entidades previstas que no coinciden con ninguna anotación en el documento de prueba.
Falsos negativos: Son las anotaciones en el documento de prueba que no coinciden con ninguna de las entidades previstas.
- Falsos negativos (por debajo del umbral): Son las anotaciones en el documento de prueba que coincidirían con una entidad prevista, pero el valor de confianza de la entidad prevista está por debajo del umbral de confianza especificado.
Límite de confianza
La lógica de evaluación ignora las predicciones con una confianza inferior al umbral de confianza especificado, incluso si la predicción es correcta. Document AI proporciona una lista de falsos negativos (por debajo del umbral), que son las anotaciones que coincidirían si el umbral de confianza se estableciera en un valor más bajo.
Document AI calcula automáticamente el umbral óptimo, que maximiza la puntuación F1 y, de forma predeterminada, establece el umbral de confianza en este valor óptimo.
Puedes elegir tu propio umbral de confianza moviendo la barra deslizante. En general, un umbral de confianza más alto genera lo siguiente:
- mayor precisión, ya que es más probable que las predicciones sean correctas.
- menor recuperación, ya que hay menos predicciones.
Entidades tabulares
Las métricas de una etiqueta superior no se calculan promediando directamente las métricas secundarias, sino aplicando el umbral de confianza de la etiqueta superior a todas sus etiquetas secundarias y agregando los resultados.
El umbral óptimo para el elemento superior es el valor del umbral de confianza que, cuando se aplica a todos los elementos secundarios, genera la puntuación F1 máxima para el elemento superior.
Comportamiento de coincidencia
Una entidad predicha coincide con una anotación en los siguientes casos:
- el tipo de la entidad prevista (
entity.type
) coincide con el nombre de la etiqueta de la anotación - el valor de la entidad prevista (
entity.mention_text
oentity.normalized_value.text
) coincide con el valor de texto de la anotación, sujeto a la búsqueda aproximada si está habilitada.
Ten en cuenta que solo se usan el tipo y el valor de texto para la coincidencia. No se usa otra información, como anclas de texto y cuadros delimitados (con la excepción de las entidades tabulares que se describen a continuación).
Etiquetas de una sola ocurrencia en comparación con etiquetas de varias ocurrencias
Las etiquetas de ocurrencia única tienen un valor por documento (por ejemplo, el ID de factura) incluso si ese valor se anota varias veces en el mismo documento (por ejemplo, el ID de factura aparece en cada página del mismo documento). Incluso si las múltiples anotaciones tienen texto diferente, se consideran iguales. En otras palabras, si una entidad predicha coincide con alguna de las anotaciones, se cuenta como una coincidencia. Las anotaciones adicionales se consideran menciones duplicadas y no contribuyen a ninguno de los recuentos de verdaderos positivos, falsos positivos ni falsos negativos.
Las etiquetas de varias ocurrencias pueden tener varios valores diferentes. Por lo tanto, cada entidad y anotación previstas se consideran y coinciden por separado. Si un documento contiene N anotaciones para una etiqueta de varias ocurrencias, puede haber N coincidencias con las entidades previstas. Cada entidad y anotación previstas se cuentan de forma independiente como un verdadero positivo, un falso positivo o un falso negativo.
Concordancias parciales
El botón de activación Coincidencia aproximada te permite endurecer o relajar algunas de las reglas de coincidencia para disminuir o aumentar la cantidad de coincidencias.
Por ejemplo, sin la concordancia aproximada, la cadena ABC
no coincide con abc
debido a la mayúscula. Sin embargo, con la concordancia parcial, sí coinciden.
Cuando se habilita la coincidencia parcial, se producen los siguientes cambios en las reglas:
Normalización de espacios en blanco: Quita los espacios en blanco iniciales y finales, y condensa los espacios en blanco intermedios consecutivos (incluidas las líneas nuevas) en espacios simples.
Eliminación de puntuación inicial o final: Quita los siguientes caracteres de puntuación inicial o final
!,.:;-"?|
.Coincidencia sin distinción entre mayúsculas y minúsculas: Convierte todos los caracteres en minúsculas.
Normalización de dinero: Para las etiquetas con el tipo de datos
money
, quita los símbolos de moneda iniciales y finales.
Entidades tabulares
Las entidades superiores y las anotaciones no tienen valores de texto y se hacen coincidir en función de los cuadros delimitados combinados de sus elementos secundarios. Si solo hay un elemento superior previsto y uno anotado, se hacen coincidir automáticamente, independientemente de los cuadros delimitadores.
Una vez que se encuentran las coincidencias de los elementos superiores, sus elementos secundarios se encuentran como si fueran entidades no tabulares. Si no hay coincidencias entre los elementos superiores, Document AI no intentará hacer coincidir sus elementos secundarios. Esto significa que las entidades secundarias se pueden considerar incorrectas, incluso con el mismo contenido de texto, si sus entidades superiores no coinciden.
Las entidades superiores o secundarias son una función de versión preliminar y solo se admiten para tablas con una capa de anidación.
Exporta métricas de evaluación
En la consola de Google Cloud, ve a la página Procesadores y elige tu procesador.
En la pestaña Evaluar y probar, haz clic en Descargar métricas para descargar las métricas de evaluación como un archivo JSON.