Respuesta a una solicitud de anotación de imagen.
Representación JSON |
---|
{ "textAnnotations": [ { object ( |
Campos | |
---|---|
textAnnotations[] |
Si está presente, la detección de texto (OCR) se completó correctamente. |
fullTextAnnotation |
Si está presente, la detección de texto (OCR) o la detección de texto (OCR) se completó correctamente. Esta anotación proporciona la jerarquía estructural del texto detectado de OCR. |
error |
Si se configura, representa el mensaje de error de la operación. Ten en cuenta que se garantiza que las anotaciones de imagen completadas sean correctas, incluso cuando se establece |
context |
Si está presente, se necesita información contextual para comprender de dónde proviene esta imagen. |
EntityAnnotation
Conjunto de atributos de la entidad detectada.
Representación JSON |
---|
{ "mid": string, "locale": string, "description": string, "score": number, "confidence": number, "topicality": number, "boundingPoly": { object ( |
Campos | |
---|---|
mid |
ID de entidad opaco. Es posible que algunos ID estén disponibles en la API de búsqueda en el Gráfico de conocimiento de Google. |
locale |
El código de idioma de la configuración regional en la que se expresa la |
description |
Descripción textual de la entidad, expresada en su idioma de |
score |
Puntuación general del resultado. Rango [0, 1]. |
confidence |
Obsoleto. Utiliza |
topicality |
La relevancia de la etiqueta ICA (Anotación del contenido de la imagen) de la imagen. Por ejemplo, la relevancia de "torre" probablemente sea más alta para una imagen que contiene la "Torre Eiffel", que para una imagen que contiene un edificio alto alejado detectado, aunque la confianza en que exista una torre en cada imagen puede ser la misma. Rango [0, 1]. |
boundingPoly |
Región de la imagen a la que pertenece esta entidad. No se produjo para características |
properties[] |
Algunas entidades pueden tener campos |
BoundingPoly
Un polígono de límite para la anotación de imagen detectada.
Representación JSON |
---|
{ "vertices": [ { object ( |
Campos | |
---|---|
vertices[] |
Vértices del polígono de límite. |
normalizedVertices[] |
Vértices normalizados del polígono de límite. |
Vertex
Un vértice representa un punto 2D en la imagen. NOTA: Las coordenadas de los vértices se encuentran en la misma escala que la imagen original.
Representación JSON |
---|
{ "x": integer, "y": integer } |
Campos | |
---|---|
x |
Coordenada de X. |
y |
Coordenada de Y. |
NormalizedVertex
Un vértice representa un punto 2D en la imagen. NOTA: Las coordenadas de vértices normalizadas están relacionadas con la imagen original y varían de 0 a 1.
Representación JSON |
---|
{ "x": number, "y": number } |
Campos | |
---|---|
x |
Coordenada de X. |
y |
Coordenada de Y. |
Propiedad
Un objeto Property
consta de un par nombre/valor proporcionado por el usuario.
Representación JSON |
---|
{ "name": string, "value": string, "uint64Value": string } |
Campos | |
---|---|
name |
El nombre de la propiedad. |
value |
Valor de la propiedad. |
uint64Value |
Valor de propiedades numéricas. |
TextAnnotation
TextAnnotation
contiene una representación estructurada del texto extraído con OCR. La jerarquía de una estructura de texto extraída de OCR es la siguiente:
TextAnnotation
-> Page -> Block -> Paragraph -> Word -> Symbol
TextAnnotation.TextProperty
que se incluye a continuación.
Representación JSON |
---|
{
"pages": [
{
object ( |
Campos | |
---|---|
pages[] |
Lista de páginas detectadas por OCR. |
text |
Texto UTF-8 detectado en las páginas. |
Página
Página detectada de OCR.
Representación JSON |
---|
{ "property": { object ( |
Campos | |
---|---|
property |
Información adicional detectada en la página. |
width |
Ancho de página. Para los archivos PDF, la unidad es puntos. Para las imágenes (incluidos los TIFF), la unidad es de píxeles. |
height |
Altura de la página. Para los archivos PDF, la unidad es puntos. Para las imágenes (incluidos los TIFF), la unidad es de píxeles. |
blocks[] |
Lista de bloques de texto, imágenes, etc. en esta página. |
confidence |
La confianza de los resultados de OCR en la página Rango [0, 1]. |
TextProperty
Información adicional detectada en el componente estructural.
Representación JSON |
---|
{ "detectedLanguages": [ { object ( |
Campos | |
---|---|
detectedLanguages[] |
Una lista de idiomas detectados y la confianza. |
detectedBreak |
El inicio y el final detectados de un segmento de texto. |
DetectedLanguage
Idioma detectado en un componente estructural.
Representación JSON |
---|
{ "languageCode": string, "confidence": number } |
Campos | |
---|---|
languageCode |
El código de idioma BCP-47, como "en-US" o "sr-Latn". Para obtener más información, consulta https://www.unicode.org/reports/tr35/#Unicode_locale_identifier. |
confidence |
La confianza del idioma detectado. Rango [0, 1]. |
DetectedBreak
Inicio o final detectado de un componente estructural.
Representación JSON |
---|
{
"type": enum ( |
Campos | |
---|---|
type |
Se detectó un tipo de salto. |
isPrefix |
Tiene el valor verdadero si el salto antecede al elemento. |
BreakType
Enumeración que indica el tipo de salto encontrado. Línea nueva, espacio, etcétera.
Enums | |
---|---|
UNKNOWN |
Tipo de etiqueta de salto desconocida. |
SPACE |
Espacio normal. |
SURE_SPACE |
Espacio grueso (muy ancho). |
EOL_SURE_SPACE |
Salto de línea. |
HYPHEN |
Guion de línea que no está presente en el texto no coincide con SPACE , LEADER_SPACE ni LINE_BREAK . |
LINE_BREAK |
Salto de línea que termina en un párrafo. |
Bloquear
Elemento lógico en la página.
Representación JSON |
---|
{ "property": { object ( |
Campos | |
---|---|
property |
Se detectó información adicional para el bloque. |
boundingBox |
El cuadro de límite del bloque. Los vértices están en el orden de la parte superior izquierda, la parte superior derecha, la parte inferior derecha y la parte inferior izquierda. Cuando se detecta una rotación del cuadro de límite, esta se representa como alrededor de la esquina superior izquierda, según se define cuando el texto se lee en la orientación “natural”. Por ejemplo:
y el orden de vértices se mantendrá como (0, 1, 2, 3). |
paragraphs[] |
Lista de párrafos en este bloque (si este bloque es de tipo de texto). |
blockType |
Se detectó un tipo de bloque (texto, imagen, etc.) para este bloque. |
confidence |
La confianza de los resultados de OCR en el bloque. Rango [0, 1]. |
Párrafo
Unidad estructural de texto que representa un número de palabras en cierto orden.
Representación JSON |
---|
{ "property": { object ( |
Campos | |
---|---|
property |
Se detectó información adicional para el párrafo. |
boundingBox |
El cuadro de límite del párrafo. Los vértices están en el orden de la parte superior izquierda, la parte superior derecha, la parte inferior derecha y la parte inferior izquierda. Cuando se detecta una rotación del cuadro de límite, esta se representa como alrededor de la esquina superior izquierda, según se define cuando el texto se lee en la orientación “natural”. Por ejemplo: * cuando el texto es horizontal, puede verse así: 0----1 | | 3----2 * cuando se rota 180 grados alrededor de la esquina superior izquierda se convierte en: 2----3 | | 1----0 y el orden de vértices se mantendrá como (0, 1, 2, 3). |
words[] |
Lista de todas las palabras de este párrafo. |
confidence |
La confianza de los resultados de OCR del párrafo. Rango [0, 1]. |
Word
Representación de palabras.
Representación JSON |
---|
{ "property": { object ( |
Campos | |
---|---|
property |
Información adicional para la palabra. |
boundingBox |
El cuadro de límite de la palabra. Los vértices están en el orden de la parte superior izquierda, la parte superior derecha, la parte inferior derecha y la parte inferior izquierda. Cuando se detecta una rotación del cuadro de límite, esta se representa como alrededor de la esquina superior izquierda, según se define cuando el texto se lee en la orientación “natural”. Por ejemplo: * cuando el texto es horizontal, puede verse así: 0----1 | | 3----2 * cuando se rota 180 grados alrededor de la esquina superior izquierda se convierte en: 2----3 | | 1----0 y el orden de vértices se mantendrá como (0, 1, 2, 3). |
symbols[] |
Lista de símbolos de la palabra. El orden de los símbolos sigue el orden natural de lectura. |
confidence |
La confianza de los resultados de OCR para la palabra. Rango [0, 1]. |
Símbolo
Representación de un solo símbolo.
Representación JSON |
---|
{ "property": { object ( |
Campos | |
---|---|
property |
Se detectó información adicional para el símbolo. |
boundingBox |
El cuadro de límite del símbolo. Los vértices están en el orden de la parte superior izquierda, la parte superior derecha, la parte inferior derecha y la parte inferior izquierda. Cuando se detecta una rotación del cuadro de límite, esta se representa como alrededor de la esquina superior izquierda, según se define cuando el texto se lee en la orientación “natural”. Por ejemplo: * cuando el texto es horizontal, puede verse así: 0----1 | | 3----2 * cuando se rota 180 grados alrededor de la esquina superior izquierda se convierte en: 2----3 | | 1----0 y el orden de vértices se mantendrá como (0, 1, 2, 3). |
text |
La representación UTF-8 real del símbolo. |
confidence |
Se obtiene la confianza de los resultados de OCR para el símbolo. Rango [0, 1]. |
BlockType
Tipo de bloque (texto, imagen, etc.) que identifica el OCR.
Enums | |
---|---|
UNKNOWN |
Tipo de bloqueo desconocido. |
TEXT |
Bloque de texto común. |
TABLE |
Bloque de tabla. |
PICTURE |
Bloque de imagen. |
RULER |
Cuadro de línea horizontal/vertical. |
BARCODE |
Bloque de código de barras. |
ImageAnnotationContext
Si se produjo una imagen a partir de un archivo (p. ej., un PDF), este mensaje contiene información sobre la fuente de la imagen.
Representación JSON |
---|
{ "uri": string, "pageNumber": integer } |
Campos | |
---|---|
uri |
El URI del archivo que se usa para producir la imagen. |
pageNumber |
Si el archivo era PDF o TIFF, este campo indica el número de página dentro del archivo que se usó para producir la imagen. |