Esta página foi traduzida pela API Cloud Translation.

Lista de processadores

Esta página contém informações detalhadas sobre todos os processadores oferecidos pela IA de documentos. Pode ver uma lista de todos os processadores por tipo de solução.

Todos os processadores do Document AI cumprem os Termos de Segurança e Tratamento de Dados.

Consulte a documentação sobre a gestão de versões do processador para ver mais detalhes. Além disso, aplicam-se limites específicos do processador, além das quotas e dos limites gerais do produto.

Digitalize texto

Enterprise Document OCR (reconhecimento ótico de carateres)

Descrição

Identificar e extrair texto em diferentes tipos de documentos.

Este processador permite-lhe identificar e extrair texto, incluindo texto manuscrito, de documentos em mais de 200 idiomas. O processador também usa a aprendizagem automática para fazer uma avaliação da qualidade de um documento com base na legibilidade do respetivo conteúdo.

Categoria Digitalize

Funções OCR, análise de qualidade

Fase de lançamento Disponibilidade geral

Estado de acesso Público

Escreva na API OCR_PROCESSOR

Idiomas suportados

Lista completa de idiomas

Nome do idioma	Etiqueta BCP 47	Script
Afrikaans	`af`	`Latn`
Albanês	`sq`	`Latn`
Árabe	`ar`	`Arab`
Arménio	`hy`	`Armn`
Bielorrusso	`be`	`Cyrl`
Bengali	`bn`	`Beng`
Bengali	`bn`	`Beng`
Búlgaro	`bg`	`Cyrl`
Catalão	`ca`	`Latn`
Chinês	`zh`	`Hani`
Croata	`hr`	`Latn`
Chéquia	`cs`	`Latn`
Dinamarquês	`da`	`Latn`
Neerlandês	`nl`	`Latn`
Inglês	`en`	`Latn`
Estónio	`et`	`Latn`
Filipino	`fil`	`Latn`
Finlandês	`fi`	`Latn`
Francês	`fr`	`Latn`
Alemão	`de`	`Latn`
Grego	`el`	`Grek`
Gujarati	`gu`	`Gujr`
Hebraico	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Húngaro	`hu`	`Latn`
Islandês	`is`	`Latn`
Indonésio	`id`	`Latn`
Italiano	`it`	`Latn`
Japonês	`ja`	`Jpan`
Canará	`kn`	`Knda`
Khmer	`km`	`Khmr`
Coreano	`ko`	`Kore`
Laosiano	`lo`	`Laoo`
Letão	`lv`	`Latn`
Lituânia	`lt`	`Latn`
Macedónio	`mk`	`Cyrl`
Malaio	`ms`	`Latn`
Malaiala	`ml`	`Mlym`
Marati	`mr`	`Deva`
Nepalês	`ne`	`Deva`
Norueguês	`no`	`Latn`
Persa	`fa`	`Arab`
Polaco	`pl`	`Latn`
Português (Portugal e Brasil)	`pt`	`Latn`
Punjabi	`pa`	`Guru`
Romeno	`ro`	`Latn`
Russo	`ru`	`Cyrl`
Sérvio	`sr`	`Cyrl`
Eslovaco	`sk`	`Latn`
Esloveno	`sl`	`Latn`
Espanhol	`es`	`Latn`
Sueco	`sv`	`Latn`
Tagalo	`tl`	`Latn`
Tamil	`ta`	`Taml`
Telugu	`te`	`Telu`
Tailandês	`th`	`Thai`
Turco	`tr`	`Latn`
Ucraniano	`uk`	`Cyrl`
Vietnamita	`vi`	`Latn`
Iídiche	`yi`	`Hebr`

Versões do processador

ID da versão	Libertar Canal	Descrição
`pretrained-ocr-v1.2-2022-11-10`	Estável	Versão do modelo congelada da v1.0: ficheiros de modelo, configurações e binários de um resumo da versão congelado numa imagem de contentor durante um máximo de 18 meses.
`pretrained-ocr-v2.0-2023-06-02`	Estável	Modelo pronto para produção especializado em exemplos de utilização de documentos. Inclui acesso a todos os suplementos de OCR.
`pretrained-ocr-v2.1-2024-08-07`	Estável	As principais áreas de melhoria da versão 2.1 são: melhor reconhecimento de texto impresso, deteção mais precisa de caixas de verificação e ordem de leitura mais precisa.
`pretrained-ocr-v2.1.1-2025-01-31`	Candidato a lançamento	A versão 2.1.1 é semelhante à versão 2.1 e está disponível em todas as regiões, exceto: `US`, `EU` e `asia-southeast1`.

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites

Número máximo de páginas (pedidos online/síncronos):	15
Número máximo de páginas (pedidos em lote/offline/assíncronos):	500
Número máximo de páginas (modo sem imagens online/pedidos síncronos):	30

Nota: para estender o limite máximo de páginas para pedidos online e síncronos até 30, certifique-se de que ativa imageless_mode no ProcessRequest.

Uptraining

Ficheiro de entrada de exemplo Abrir numa nova janela.

Exemplo de saída Abrir numa nova janela.

Regiões suportadas

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Mais informações Enterprise Document OCR

Extraia entidades de documentos

Consulte os conjuntos de dados de exemplo para ver exemplos de conjuntos de dados etiquetados e não etiquetados que pode usar para a preparação.

Extrator personalizado

Descrição

Extraia campos de documentos através da IA generativa ou de modelos personalizados; ajuste os modelos para extrair dados com precisão dos seus documentos.

Categoria Extrair

Funções OCR, extração de entidades

Fase de lançamento Disponibilidade geral

Estado de acesso Público

Escreva na API CUSTOM_EXTRACTION_PROCESSOR

Notes

Se usar a IA generativa para extração:
- Apenas o idioma inglês é oficialmente suportado.
- A disponibilidade regional está em US, EU, northamerica-northeast1 e asia-southeast1.

Idiomas suportados

Lista completa de idiomas

Nome do idioma	Etiqueta BCP 47	Script
Afrikaans	`af`	`Latn`
Árabe	`ar`	`Arab`
Azeri	`az`	`Latn`
Azerbaijano (cirílico)	`az-Cyrl`	`Cyrl`
Bielorrusso	`be`	`Cyrl`
Búlgaro	`bg`	`Cyrl`
Bósnio	`bs`	`Latn`
Catalão	`ca`	`Latn`
Cebuano	`ceb`	`Latn`
Chéquia	`cs`	`Latn`
Galês	`cy`	`Latn`
Dinamarquês	`da`	`Latn`
Alemão	`de`	`Latn`
Grego	`el`	`Grek`
Inglês	`en`	`Latn`
Esperanto	`eo`	`Latn`
Espanhol	`es`	`Latn`
Estónio	`et`	`Latn`
Basco	`eu`	`Latn`
Persa	`fa`	`Arab`
Finlandês	`fi`	`Latn`
Filipino	`fil`	`Latn`
Francês	`fr`	`Latn`
Irlandês	`ga`	`Latn`
Galego	`gl`	`Latn`
Hindi	`hi`	`Deva`
Croata	`hr`	`Latn`
Crioulo haitiano	`ht`	`Latn`
Húngaro	`hu`	`Latn`
Indonésio	`id`	`Latn`
Islandês	`is`	`Latn`
Italiano	`it`	`Latn`
Hebraico	`iw`	`Hebr`
Japonês	`ja`	`Jpan`
Javanês	`jv`	`Latn`
Cazaque	`kk`	`Cyrl`
Coreano	`ko`	`Kore`
Quirguize	`ky`	`Cyrl`
Latim	`la`	`Latn`
Lituânia	`lt`	`Latn`
Letão	`lv`	`Latn`
Macedónio	`mk`	`Cyrl`
Mongol	`mn`	`Cyrl`
Marati	`mr`	`Deva`
Malaio	`ms`	`Latn`
Maltês	`mt`	`Latn`
Nepalês	`ne`	`Deva`
Neerlandês	`nl`	`Latn`
Norueguês	`no`	`Latn`
Polaco	`pl`	`Latn`
Pastó	`ps`	`Arab`
Português (Portugal e Brasil)	`pt`	`Latn`
Romeno	`ro`	`Latn`
Russo	`ru`	`Cyrl`
Russo (ortografia petrina)	`ru-PETR1708`	`Cyrl`
Sânscrito	`sa`	`Deva`
Eslovaco	`sk`	`Latn`
Esloveno	`sl`	`Latn`
Albanês	`sq`	`Latn`
Sérvio	`sr`	`Cyrl`
Sueco	`sv`	`Latn`
Suaíli	`sw`	`Latn`
Tagalo	`tl`	`Latn`
Turco	`tr`	`Latn`
Ucraniano	`uk`	`Cyrl`
Urdu	`ur`	`Arab`
Usbeque	`uz`	`Latn`
Usbeque (cirílico)	`uz-Cyrl`	`Cyrl`
Vietnamita	`vi`	`Latn`
Iídiche	`yi`	`Hebr`
Chinês (simplificado)	`zh-Hans`	`Hani`
Chinês (tradicional)	`zh-Hant`	`Hani`
Zulu	`zu`	`Latn`

Versões do processador

ID da versão	Libertar Canal	Descrição
`pretrained-foundation-model-v1.4-2025-02-05`	Estável	Modelo de disponibilidade geral com tecnologia do MDL/CE Gemini 2.0 Flash. Também inclui funcionalidades de OCR avançadas, como a deteção de caixas de verificação. Nota: a partir de 5 de fevereiro de 2026, esta versão deixa de estar acessível.
`pretrained-foundation-model-v1.5-2025-05-05`	Estável	Candidato pronto para produção com tecnologia do MDL/CE Gemini 2.5 Flash. Recomendado para quem quer experimentar modelos mais recentes.
`pretrained-foundation-model-v1.5-pro-2025-06-20`	Estável	Modelo pronto para produção com tecnologia do MDL/CE Gemini 2.5 Pro. Suporta uma quota de até 30 páginas por minuto para pedidos de processos online. Este modelo tem uma qualidade melhorada em comparação com a v1.5 e pode ter uma latência mais elevada.

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites

Número máximo de páginas (pedidos online/síncronos):	15
Número máximo de páginas (pedidos em lote/offline/assíncronos):	200
Número máximo de páginas (modo sem imagens online/pedidos síncronos):	30

Nota: para estender o limite máximo de páginas para pedidos online e síncronos até 30, certifique-se de que ativa imageless_mode no ProcessRequest.

Tipos de dados normalizados

Pode encontrar mais informações nas páginas Enriquecimento e normalização e Criar conjunto de dados.

Lista completa de tipos de dados normalizados

dateTime as STRING
currency as STRING
money as google.type.Money
number as FLOAT or INTEGER

Uptraining

Ficheiro de entrada de exemplo Abrir numa nova janela.

Exemplo de saída Abrir numa nova janela.

Regiões suportadas

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Mais informações Extrator personalizado

Analisador de formulários

Descrição

Extraia pares de chave-valor gerais (entidade e caixa de verificação), tabelas e entidades genéricas de documentos, além do texto de OCR.

Este processador aplica tecnologias de aprendizagem automática avançadas para extrair pares de chave-valor, caixas de verificação e tabelas de documentos em mais de 200 idiomas. Este processador também tira partido de modelos de aprendizagem profunda para extrair 11 entidades genéricas comuns em vários tipos de documentos.

Categoria Extrair

Funções OCR, análise de formulários e extração de entidades

Fase de lançamento Disponibilidade geral

Estado de acesso Público

Escreva na API FORM_PARSER_PROCESSOR

Idiomas suportados

Lista completa de idiomas

Nome do idioma	Etiqueta BCP 47	Script
Afrikaans	`af`	`Latn`
Albanês	`sq`	`Latn`
Árabe	`ar`	`Arab`
Bielorrusso	`be`	`Cyrl`
Catalão	`ca`	`Latn`
Chinês	`zh`	`Hani`
Croata	`hr`	`Latn`
Chéquia	`cs`	`Latn`
Dinamarquês	`da`	`Latn`
Neerlandês	`nl`	`Latn`
Inglês	`en`	`Latn`
Estónio	`et`	`Latn`
Filipino	`fil`	`Latn`
Finlandês	`fi`	`Latn`
Francês	`fr`	`Latn`
Alemão	`de`	`Latn`
Hebraico	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Húngaro	`hu`	`Latn`
Islandês	`is`	`Latn`
Indonésio	`id`	`Latn`
Italiano	`it`	`Latn`
Japonês	`ja`	`Jpan`
Coreano	`ko`	`Kore`
Letão	`lv`	`Latn`
Lituânia	`lt`	`Latn`
Macedónio	`mk`	`Cyrl`
Malaio	`ms`	`Latn`
Marati	`mr`	`Deva`
Nepalês	`ne`	`Deva`
Norueguês	`no`	`Latn`
Persa	`fa`	`Arab`
Polaco	`pl`	`Latn`
Português (Portugal e Brasil)	`pt`	`Latn`
Romeno	`ro`	`Latn`
Russo	`ru`	`Cyrl`
Sérvio	`sr`	`Cyrl`
Eslovaco	`sk`	`Latn`
Esloveno	`sl`	`Latn`
Espanhol	`es`	`Latn`
Sueco	`sv`	`Latn`
Tagalo	`tl`	`Latn`
Turco	`tr`	`Latn`
Ucraniano	`uk`	`Cyrl`
Vietnamita	`vi`	`Latn`
Iídiche	`yi`	`Hebr`

Versões do processador

ID da versão	Libertar Canal	Campos adicionais detetados	Descrição
`pretrained-form-parser-v1.0-2020-09-23`	Estável	Nenhum	Versão antiga. Para obter a melhor qualidade e o conjunto completo de funcionalidades, use o analisador de formulários v2.0.
`pretrained-form-parser-v2.0-2022-11-10`	Estável	Mostrar campos `email` `phone` `url` `date_time` `address` `person` `organization` `quantity` `price` `id` `page_number`	Versão recomendada. Suporta entidades genéricas e inclui um modelo de tabela, KVP e caixa de verificação atualizado, bem como mais de 200 idiomas.
`pretrained-form-parser-v2.1-2023-06-26`	Candidato a lançamento	Nenhum	Versão de pré-visualização pública. O mesmo modelo que a v2.0 com a extração de texto nativa de ficheiros PDF digitais ativada.

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites

Número máximo de páginas (pedidos online/síncronos):	15
Número máximo de páginas (pedidos em lote/offline/assíncronos):	100
Número máximo de páginas (modo sem imagens online/pedidos síncronos):	30

Nota: para estender o limite máximo de páginas para pedidos online e síncronos até 30, certifique-se de que ativa imageless_mode no ProcessRequest.

Uptraining

Ficheiro de entrada de exemplo Abrir numa nova janela.

Exemplo de saída Abrir numa nova janela.

Regiões suportadas

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Mais informações Analisador de formulários

Analisador de esquemas

Descrição

Extrai elementos de conteúdo de documentos (texto, tabelas e listas) e cria blocos sensíveis ao contexto.

O Layout Parser extrai elementos de conteúdo de documentos, como texto, tabelas e listas, e cria blocos sensíveis ao contexto que facilitam a obtenção de informações em aplicações de IA generativa e de descoberta.

Categoria Extrair

Funções Análise de esquemas, divisão de documentos

Fase de lançamento Disponibilidade geral

Estado de acesso Público

Escreva na API LAYOUT_PARSER_PROCESSOR

Notes

Este analisador suporta ficheiros PDF, HTML, DOCX, PPTX e XLSX/XLSM.

Idiomas suportados

Lista completa de idiomas

Nome do idioma	Etiqueta BCP 47	Script
Afrikaans	`af`	`Latn`
Albanês	`sq`	`Latn`
Árabe	`ar`	`Arab`
Arménio	`hy`	`Armn`
Bielorrusso	`be`	`Cyrl`
Bengali	`bn`	`Beng`
Bengali	`bn`	`Beng`
Búlgaro	`bg`	`Cyrl`
Catalão	`ca`	`Latn`
Chinês	`zh`	`Hani`
Croata	`hr`	`Latn`
Chéquia	`cs`	`Latn`
Dinamarquês	`da`	`Latn`
Neerlandês	`nl`	`Latn`
Inglês	`en`	`Latn`
Estónio	`et`	`Latn`
Filipino	`fil`	`Latn`
Finlandês	`fi`	`Latn`
Francês	`fr`	`Latn`
Alemão	`de`	`Latn`
Grego	`el`	`Grek`
Gujarati	`gu`	`Gujr`
Hebraico	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Húngaro	`hu`	`Latn`
Islandês	`is`	`Latn`
Indonésio	`id`	`Latn`
Italiano	`it`	`Latn`
Japonês	`ja`	`Jpan`
Canará	`kn`	`Knda`
Khmer	`km`	`Khmr`
Coreano	`ko`	`Kore`
Laosiano	`lo`	`Laoo`
Letão	`lv`	`Latn`
Lituânia	`lt`	`Latn`
Macedónio	`mk`	`Cyrl`
Malaio	`ms`	`Latn`
Malaiala	`ml`	`Mlym`
Marati	`mr`	`Deva`
Nepalês	`ne`	`Deva`
Norueguês	`no`	`Latn`
Persa	`fa`	`Arab`
Polaco	`pl`	`Latn`
Português (Portugal e Brasil)	`pt`	`Latn`
Punjabi	`pa`	`Guru`
Romeno	`ro`	`Latn`
Russo	`ru`	`Cyrl`
Sérvio	`sr`	`Cyrl`
Eslovaco	`sk`	`Latn`
Esloveno	`sl`	`Latn`
Espanhol	`es`	`Latn`
Sueco	`sv`	`Latn`
Tagalo	`tl`	`Latn`
Tamil	`ta`	`Taml`
Telugu	`te`	`Telu`
Tailandês	`th`	`Thai`
Turco	`tr`	`Latn`
Ucraniano	`uk`	`Cyrl`
Vietnamita	`vi`	`Latn`
Iídiche	`yi`	`Hebr`

Versões do processador

ID da versão	Libertar Canal	Descrição
`pretrained-layout-parser-v1.0-2024-06-03`	Estável	Versão recomendada.

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites

Número máximo de páginas (pedidos online/síncronos):	15
Número máximo de páginas (pedidos em lote/offline/assíncronos):	500
Número máximo de páginas (modo sem imagens online/pedidos síncronos):	30

Nota: para estender o limite máximo de páginas para pedidos online e síncronos até 30, certifique-se de que ativa imageless_mode no ProcessRequest.

Uptraining

Ficheiro de entrada de exemplo Abrir numa nova janela.

Exemplo de saída Abrir numa nova janela.

Regiões suportadas

eu
us

Mais informações Layout Parser

Explore processadores pré-formados

Analisador de extratos de conta

Descrição

Extrair informações de extratos bancários, incluindo nome, conta, transações, etc.

Categoria Pré-treinado

Funções OCR, extração de entidades

Fase de lançamento Disponibilidade geral

Estado de acesso Público

Escreva na API BANK_STATEMENT_PROCESSOR

Notes

Se uma página de um ficheiro de entrada com várias páginas for o tipo de documento correto e uma das versões suportadas, o processador realiza a extração de entidades no primeiro documento suportado. Se o processador não encontrar documentos aplicáveis no ficheiro de entrada, devolve uma mensagem de erro.

Idiomas suportados

Nome do idioma	Etiqueta BCP 47	Script	Escrita manual suportada
Inglês	`en`	`Latn`

Versões do processador

ID da versão	Libertar Canal	Descrição
`pretrained-bankstatement-v1.0-2021-08-08`	Estável
`pretrained-bankstatement-v1.1-2021-08-13`	Estável
`pretrained-bankstatement-v2.0-2021-12-10`	Estável
`pretrained-bankstatement-v3.0-2022-05-16`	Estável	Esta versão pressupõe que o ficheiro de entrada contém um único extrato bancário. Ao contrário da versão predefinida, esta versão não verifica o ficheiro de entrada quanto a extratos de conta e não devolve um erro se não forem encontrados extratos de conta.
`pretrained-bankstatement-v4.0-2023-07-31`	Candidato a lançamento
`pretrained-bankstatement-v5.0-2023-12-06`	Candidato a lançamento

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites

Número máximo de páginas (pedidos online/síncronos):	15
Número máximo de páginas (pedidos em lote/offline/assíncronos):	30
Número máximo de páginas (modo sem imagens online/pedidos síncronos):	30

Nota: para estender o limite máximo de páginas para pedidos online e síncronos até 30, certifique-se de que ativa imageless_mode no ProcessRequest.

Campos detetados na versão mais antiga

Também pode encontrar estas informações na página Campo detetado.

Lista completa de campos

account_number
account_type
bank_address
bank_name
client_address
client_name
ending_balance
starting_balance
statement_date
statement_end_date
statement_start_date
table_item

table_item/transaction_deposit
table_item/transaction_deposit_date
table_item/transaction_deposit_description
table_item/transaction_withdrawal
table_item/transaction_withdrawal_date
table_item/transaction_withdrawal_description

Campos enriquecidos

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos enriquecidos

bank_address
bank_name

Campos normalizados

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos normalizados

ending_balance
starting_balance
statement_date
statement_end_date
statement_start_date
table_item/transaction_deposit
table_item/transaction_deposit_date
table_item/transaction_withdrawal
table_item/transaction_withdrawal_date

Uptraining

Instruções de etiquetagem Abrir numa nova janela.

Ficheiro de entrada de exemplo Abrir numa nova janela.

Exemplo de saída Abrir numa nova janela.

Regiões suportadas

eu
us

Analisador W2

Descrição

Extrair do formulário W2, incluindo o funcionário, a entidade patronal, os salários, etc.

Categoria Pré-treinado

Funções OCR, extração de entidades

Fase de lançamento Disponibilidade geral

Estado de acesso Público

Escreva na API FORM_W2_PROCESSOR

Notes

Se uma página de um ficheiro de entrada com várias páginas for o tipo de documento correto e uma das versões suportadas, o processador realiza a extração de entidades no primeiro documento suportado. Se o processador não encontrar documentos aplicáveis no ficheiro de entrada, devolve uma mensagem de erro.

Idiomas suportados

Nome do idioma	Etiqueta BCP 47	Script	Escrita manual suportada
Inglês	`en`	`Latn`

Formulário/versões suportados

2020 (versões padrão e personalizadas)
2019 (versões padrão e personalizadas)
2018 (versões padrão e personalizadas)

Versões do processador

ID da versão	Libertar Canal	Campos adicionais detetados	Descrição
`pretrained-w2-v1.0-2020-10-01`	Estável	Nenhum
`pretrained-w2-v1.1-2022-01-27`	Estável	Nenhum
`pretrained-w2-v1.2-2022-01-28`	Estável	Mostrar campos `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress` `EmployeeName` `EmployerNameAndAddress` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalityName_Line1` `LocalWagesTipsEtc_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `SSN` `State_Line1` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `WagesTipsOtherCompensation`	Melhorias de qualidade e suporte de novos campos; não inclui o separador.
`pretrained-w2-v2.0-2022-03-30`	Candidato a lançamento	Mostrar campos `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress_AdditionalStreetAddressOrPostalBox` `EmployeeAddress_City` `EmployeeAddress_State` `EmployeeAddress_StreetAddressOrPostalBox` `EmployeeAddress_Zip` `EmployeeName_FirstName` `EmployeeName_LastName` `EmployeeName_MiddleNameOrInitial` `EmployerAddress_AdditionalStreetAddressOrPostalBox` `EmployerAddress_City` `EmployerAddress_State` `EmployerAddress_StreetAddressOrPostalBox` `EmployerAddress_Zip` `EmployerName` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalWagesTipsEtc_Line1` `LocalityName_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SSN` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `State_Line1` `WagesTipsOtherCompensation` `a_Code` `a_Value` `b_Code` `b_Value` `c_Code` `c_Value` `d_Code` `d_Value`	Melhorias na qualidade e suporte para campos da caixa 12 e previsões detalhadas de `EmployeeName`, `EmployeeAddress` e `EmployerNameAndAddress`, que já não fazem parte do resultado e são substituídos por campos adicionais.
`pretrained-w2-v2.1-2022-06-08`	Estável	Mostrar campos `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress_AdditionalStreetAddressOrPostalBox` `EmployeeAddress_City` `EmployeeAddress_State` `EmployeeAddress_StreetAddressOrPostalBox` `EmployeeAddress_Zip` `EmployeeName_FirstName` `EmployeeName_LastName` `EmployeeName_MiddleNameOrInitial` `EmployeeName_Suffix` `EmployerAddress_AdditionalStreetAddressOrPostalBox` `EmployerAddress_City` `EmployerAddress_State` `EmployerAddress_StreetAddressOrPostalBox` `EmployerAddress_Zip` `EmployerName` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalWagesTipsEtc_Line1` `LocalityName_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SSN` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `State_Line1` `WagesTipsOtherCompensation` `a_Code` `a_Value` `b_Code` `b_Value` `c_Code` `c_Value` `d_Code` `d_Value`	Semelhante à versão `pretrained-w2-v2.0-2022-03-30`, com melhorias de qualidade adicionais e a introdução de mais uma entidade `EmployeeName_Suffix`.

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites

Número máximo de páginas (pedidos online/síncronos):	15
Número máximo de páginas (pedidos em lote/offline/assíncronos):	15
Número máximo de páginas (modo sem imagens online/pedidos síncronos):	15

Nota: para estender o limite máximo de páginas para pedidos online e síncronos até 30, certifique-se de que ativa imageless_mode no ProcessRequest.

Campos detetados na versão mais antiga

Também pode encontrar estas informações na página Campo detetado.

Lista completa de campos

ControlNumber
EIN
EmployeeAddress
EmployeeName
EmployerNameAndAddress
FederalIncomeTaxWithheld
MedicareTaxWithheld
MedicareWagesAndTips
SSN
SocialSecurityTaxWithheld
SocialSecurityWages
WagesTipsOtherCompensation

Campos enriquecidos

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos enriquecidos

EmployerNameAndAddress
EIN

Uptraining

Ficheiro de entrada de exemplo Abrir numa nova janela.

Exemplo de saída Abrir numa nova janela.

Regiões suportadas

eu
us

Analisador de passaportes dos EUA

Descrição

Extrair campos como nomes, ID do documento, data de nascimento, etc.

Categoria Pré-treinado

Funções OCR, extração de entidades

Fase de lançamento Disponibilidade geral

Estado de acesso Público

Escreva na API US_PASSPORT_PROCESSOR

Idiomas suportados

Nome do idioma	Etiqueta BCP 47	Script	Escrita manual suportada
Inglês	`en`	`Latn`

Versões do processador

ID da versão	Libertar Canal	Descrição
`pretrained-us-passport-v1.0-2021-06-14`	Estável

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites

Número máximo de páginas (pedidos online/síncronos):	2
Número máximo de páginas (pedidos em lote/offline/assíncronos):	2
Número máximo de páginas (modo sem imagens online/pedidos síncronos):	2

Nota: para estender o limite máximo de páginas para pedidos online e síncronos até 30, certifique-se de que ativa imageless_mode no ProcessRequest.

Campos detetados na versão mais antiga

Também pode encontrar estas informações na página Campo detetado.

Lista completa de campos

Family Name
Given Names
Document Id
Expiration Date
Date Of Birth
Issue Date
MRZ Code
Portrait

Campos normalizados

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos normalizados

Date Of Birth
Expiration Date
Issue Date

Uptraining

Ficheiro de entrada de exemplo Abrir numa nova janela.

Exemplo de saída Abrir numa nova janela.

Regiões suportadas

eu
us

Analisador de utilitários

Descrição

Extrair texto e valores de faturas de serviços, como o nome do fornecedor e o valor pago anteriormente.

Categoria Pré-treinado

Funções OCR, extração de entidades

Fase de lançamento Disponibilidade geral

Estado de acesso Limitada ^[*]

Escreva na API UTILITY_PROCESSOR

Idiomas suportados

Nome do idioma	Etiqueta BCP 47	Script	Escrita manual suportada
Inglês	`en`	`Latn`

Versões do processador

ID da versão	Libertar Canal	Descrição
`pretrained-utility-v1.1-2021-04-09`	Estável
`pretrained-utility-v1.2-2022-12-15`	Candidato a lançamento

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites

Número máximo de páginas (pedidos online/síncronos):	10
Número máximo de páginas (pedidos em lote/offline/assíncronos):	200
Número máximo de páginas (modo sem imagens online/pedidos síncronos):	30

Nota: para estender o limite máximo de páginas para pedidos online e síncronos até 30, certifique-se de que ativa imageless_mode no ProcessRequest.

Campos detetados na versão mais antiga

Também pode encontrar estas informações na página Campo detetado.

Lista completa de campos

adjusted_amount
amount_due
balance_transfer_amount
carrier
currency
currency_exchange_rate
delivery_date
deposit_credited_amount
due_date
freight_amount
invoice_date
invoice_id
late_fee_amount
line_item

line_item/amount
line_item/description
line_item/frequency
line_item/product_code
line_item/purchase_order
line_item/quantity
line_item/service_address
line_item/service_end_date
line_item/service_id_1
line_item/service_id_2
line_item/service_start_date
line_item/supplier_account_number
line_item/tax_amount
line_item/unit_number
line_item/unit_of_measure
line_item/unit_price
line_item/usage

net_amount
payment_terms
prior_amount_due
prior_paid_amount
purchase_order
receiver_address
receiver_email
receiver_name
receiver_phone
receiver_tax_id
receiver_website
reclaimed_water
remit_to_address
remit_to_name
service

service/service_end_date
service/service_id
service/service_start_date
service/unit_of_measure
service/usage

service_address
service_end_date
service_id
service_start_date
ship_from_address
ship_from_name
ship_to_address
ship_to_name
supplier_account_number
supplier_address
supplier_email
supplier_iban
supplier_name
supplier_payment_ref
supplier_phone
supplier_registration
supplier_tax_id
supplier_website
tampering
total_amount
total_tax_amount
usage
vat

vat/amount
vat/category_code
vat/tax_amount
vat/tax_rate

Campos normalizados

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos normalizados

adjusted_amount
amount_due
balance_transfer_amount
currency
currency_exchange_rate
delivery_date
due_date
invoice_date
late_fee_amount
line_item/amount
line_item/quantity
line_item/tax_amount
line_item/unit_price
net_amount
prior_amount_due
prior_paid_amount
total_amount
total_tax_amount

Uptraining

Instruções de etiquetagem Abrir numa nova janela.

Ficheiro de entrada de exemplo Abrir numa nova janela.

Exemplo de saída Abrir numa nova janela.

Regiões suportadas

eu
us

Analisador de validação de documentos de identificação

Descrição

Prever a validade de documentos de identificação através de vários sinais.

O processador de validação de documentos de identidade foi concebido para ajudar a prever a validade de documentos de identificação com quatro sinais diferentes.

Atualmente, o processador devolve informações dos seguintes sinais:

Deteção de fraud_signals_is_identity_document: prevê se uma imagem contém um documento de identificação reconhecido.
fraud_signals_suspicious_words deteção: prevê se existem palavras que não são típicas em IDs.
fraud_signals_image_manipulation deteção: prevê se a imagem foi alterada ou adulterada com uma ferramenta de edição de imagens.
fraud_signals_online_duplicate deteção: prevê se a imagem pode ser encontrada online (apenas nos EUA).

Categoria Pré-treinado

Funções OCR, análise de qualidade

Fase de lançamento Disponibilidade geral

Estado de acesso Público

Escreva na API ID_PROOFING_PROCESSOR

Notes

Atualmente, a funcionalidade de deteção de duplicados online é processada em centros de dados dos EUA. O suporte regional e multirregional não está disponível para esta funcionalidade fora dos EUA.
Este processador é suportado por algoritmos que são atualizados com mais frequência do que as novas versões do processador. Por este motivo, o processador pode devolver resultados diferentes ao longo do tempo, mesmo quando usa a mesma versão do processador. Por exemplo, o sistema de deteção de duplicados online monitoriza as imagens presentes na Web. O comportamento do sistema pode, então, mudar mais rapidamente do que o que pode ser monitorizado nas versões do processador.
Consulte as notas sobre a IA responsável^[†] e a revisão humana.^[‡]

Idiomas suportados

Nome do idioma	Etiqueta BCP 47	Script	Escrita manual suportada
Inglês	`en`	`Latn`

Formulário/versões suportados

Suporte para passaportes, cartões de passaporte e cartas de condução dos EUA.

Versões do processador

ID da versão	Libertar Canal	Campos adicionais detetados	Descrição
`pretrained-id-proofing-v1.0-2022-10-03`	Estável	Nenhum
`pretrained-id-proofing-v1.1-2023-05-18`	Candidato a lançamento	Mostrar campos `fraud_signals_photocopy_detection`	Sinal de deteção de fotocópia adicional
`pretrained-id-proofing-v1.2-2023-10-04`	Candidato a lançamento	Mostrar campos `fraud_signals_photocopy_detection`

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites

Número máximo de páginas (pedidos online/síncronos):	2
Número máximo de páginas (pedidos em lote/offline/assíncronos):	2
Número máximo de páginas (modo sem imagens online/pedidos síncronos):	2

Nota: para estender o limite máximo de páginas para pedidos online e síncronos até 30, certifique-se de que ativa imageless_mode no ProcessRequest.

Campos detetados na versão mais antiga

Também pode encontrar estas informações na página Campo detetado.

Lista completa de campos

fraud_signals_is_identity_document
fraud_signals_suspicious_words
evidence_suspicious_word
evidence_inconclusive_suspicious_word
fraud_signals_image_manipulation
fraud_signals_online_duplicate (US only)
fraud_signals_photocopy_detection
evidence_hostname (US only)
evidence_thumbnail_url (US only)

Campos normalizados

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos normalizados

fraud_signals_image_manipulation
fraud_signals_online_duplicate (US only)
fraud_signals_is_identity_document
fraud_signals_suspicious_words

Uptraining

Ficheiro de entrada de exemplo Abrir numa nova janela.

Exemplo de saída Abrir numa nova janela.

Regiões suportadas

eu
us

Analisador de recibos de pagamento

Descrição

Extrato de recibos de vencimento, incluindo nome, empresa, valores, etc.

Categoria Pré-treinado

Funções OCR, extração de entidades

Fase de lançamento Disponibilidade geral

Estado de acesso Público

Escreva na API PAYSTUB_PROCESSOR

Notes

Se o documento de entrada de várias páginas contiver mais do que um recibo de vencimento válido, o processador extrai entidades apenas do primeiro recibo de vencimento válido. Se não forem encontradas folhas de pagamento no ficheiro de entrada, o processador devolve uma mensagem de erro.

Idiomas suportados

Nome do idioma	Etiqueta BCP 47	Script	Escrita manual suportada
Inglês	`en`	`Latn`

Versões do processador

ID da versão	Libertar Canal	Campos adicionais detetados	Descrição
`pretrained-paystub-v1.0-2021-03-19`	Estável	Nenhum
`pretrained-paystub-v1.1-2021-08-13`	Estável	Mostrar campos `net_pay` `net_pay_ytd` `employee_account_number`	Melhoria da qualidade e suporte de novos campos;
`pretrained-paystub-v1.2-2021-12-10`	Estável	Nenhum
`pretrained-paystub-v2.0-2022-05-17`	Candidato a lançamento	Mostrar campos `deduction_item` `deduction_item/deduction_type` `deduction_item/deduction_this_period` `deduction_item/deduction_ytd` `direct_deposit_item` `direct_deposit_item/direct_deposit` `direct_deposit_item/employee_account_number` `earning_item` `earning_item/earning_type` `earning_item/earning_rate` `earning_item/earning_hours` `earning_item/earning_this_period` `earning_item/earning_ytd` `page_number` `tax_item` `tax_item/tax_type` `tax_item/tax_this_period` `tax_item/tax_ytd` `federal_additional_tax` `federal_allowance` `federal_marital_status` `state_additional_tax` `state_allowance` `state_marital_status`	Esta versão pressupõe que o ficheiro de entrada contém um único recibo de vencimento. Ao contrário da versão predefinida, esta versão não verifica o ficheiro de entrada quanto a recibos de vencimento e não devolve um erro se não forem encontrados recibos de vencimento. Melhoria da qualidade, suporte de novos campos e novo esquema. Os bónus, as comissões, os feriados, as horas extraordinárias, o salário normal e as férias fazem agora parte de earning_item/earning_this_period, e as respetivas versões desde o início do ano estão em earning_item/earning_ytd. O depósito direto e o número de conta do funcionário estão agora aninhados em direct_deposit_item. O limite de páginas assíncronas é 10.
`pretrained-paystub-v2.0-2022-07-22`	Estável	Nenhum	Melhoria da qualidade e melhoramentos da atualização.
`pretrained-paystub-v3.0-2023-12-06`	Candidato a lançamento	Nenhum

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites

Número máximo de páginas (pedidos online/síncronos):	15
Número máximo de páginas (pedidos em lote/offline/assíncronos):	50
Número máximo de páginas (modo sem imagens online/pedidos síncronos):	30

Nota: para estender o limite máximo de páginas para pedidos online e síncronos até 30, certifique-se de que ativa imageless_mode no ProcessRequest.

Campos detetados na versão mais antiga

Também pode encontrar estas informações na página Campo detetado.

Lista completa de campos

bonus
bonus_ytd
commissions
commissions_ytd
direct_deposit
employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
employee_address
employee_name
employer_address
employer_name
end_date
gross_earnings
gross_earnings_ytd
holiday
holiday_ytd
net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
overtime
overtime_ytd
pay_date
regular_pay
regular_pay_ytd
ssn
start_date
vacation
vacation_ytd

Campos enriquecidos

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos enriquecidos

employer_address
employer_name

Campos normalizados

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos normalizados

bonus
bonus_ytd
commissions
commissions_ytd
direct_deposit
end_date
gross_earnings
gross_earnings_ytd
holiday
holiday_ytd
net_pay
net_pay_ytd
overtime
overtime_ytd
pay_date
regular_pay
regular_pay_ytd
start_date
vacation
vacation_ytd

Uptraining

Instruções de etiquetagem Abrir numa nova janela.

Regiões suportadas

eu
us

Analisador de cartas de condução dos EUA

Descrição

Extrair campos como nomes, ID do documento, data de nascimento, etc.

Categoria Pré-treinado

Funções OCR, extração de entidades

Fase de lançamento Disponibilidade geral

Estado de acesso Público

Escreva na API US_DRIVER_LICENSE_PROCESSOR

Idiomas suportados

Nome do idioma	Etiqueta BCP 47	Script	Escrita manual suportada
Inglês	`en`	`Latn`

Formulário/versões suportados

Suporta todos os 50 estados e o Distrito de Columbia

Versões do processador

ID da versão	Libertar Canal	Descrição
`pretrained-us-driver-license-v1.0-2021-06-14`	Estável

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites

Número máximo de páginas (pedidos online/síncronos):	2
Número máximo de páginas (pedidos em lote/offline/assíncronos):	2
Número máximo de páginas (modo sem imagens online/pedidos síncronos):	2

Nota: para estender o limite máximo de páginas para pedidos online e síncronos até 30, certifique-se de que ativa imageless_mode no ProcessRequest.

Campos detetados na versão mais antiga

Também pode encontrar estas informações na página Campo detetado.

Lista completa de campos

Family Name
Given Names
Document Id
Expiration Date
Date Of Birth
Issue Date
Address
Portrait

Campos normalizados

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos normalizados

Date Of Birth
Expiration Date
Issue Date

Uptraining

Ficheiro de entrada de exemplo Abrir numa nova janela.

Exemplo de saída Abrir numa nova janela.

Regiões suportadas

eu
us

Analisador de despesas

Descrição

Extrair texto e valores de documentos de despesas, como a data da despesa, o nome do fornecedor, o valor total e a moeda.

Categoria Pré-treinado

Funções OCR, extração de entidades

Fase de lançamento Disponibilidade geral

Estado de acesso Público

Escreva na API EXPENSE_PROCESSOR

Idiomas suportados

Lista completa de idiomas

Nome do idioma	Etiqueta BCP 47	Script
Alemão	`de`	`Latn`
Inglês	`en`	`Latn`
Espanhol	`es`	`Latn`
Francês	`fr`	`Latn`
Japonês	`ja`	`Jpan`
Neerlandês	`nl`	`Latn`

Versões do processador

ID da versão	Libertar Canal	Campos adicionais detetados	Idiomas adicionais suportados	Descrição
`pretrained-expense-v1.1-2021-04-09`	Estável	Nenhum	Nenhum	Lançado em abril de 2021.
`pretrained-expense-v1.3.2-2024-09-11`	Candidato a lançamento	Mostrar campos `credit_card_last_four_digits` `line_item/quantity` `payment_type`	`ja`: japonês	Uma atualização para a v1.3 com um modelo de visão subjacente melhorado.
`pretrained-expense-v1.4-2022-11-18`	Candidato a lançamento	Mostrar campos `traveler_name` `reservation_id` `line_item/transaction_date`	`ja`: japonês `it`: italiano `pt`: português (Portugal e Brasil)	Melhorias no desempenho e suporte para atualizações. O limite máximo de páginas (pedidos online/síncronos) foi aumentado para 15. Nota: vai ser descontinuada nos Estados Unidos (EUA) e na União Europeia (UE) a partir de 30 de abril de 2025.
`pretrained-expense-v1.4.2-2024-09-12`	Candidato a lançamento	Mostrar campos `traveler_name` `reservation_id` `line_item/transaction_date`	`ja`: japonês `it`: italiano `pt`: português (Portugal e Brasil)	Uma atualização para a v1.4 com um modelo de visão subjacente melhorado.

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites

Número máximo de páginas (pedidos online/síncronos):	10
Número máximo de páginas (pedidos em lote/offline/assíncronos):	10
Número máximo de páginas (modo sem imagens online/pedidos síncronos):	10

Nota: para estender o limite máximo de páginas para pedidos online e síncronos até 30, certifique-se de que ativa imageless_mode no ProcessRequest.

Campos detetados na versão mais antiga

Também pode encontrar estas informações na página Campo detetado.

Lista completa de campos

credit_card_last_four_digits
currency
end_date
net_amount
payment_type
purchase_time
receipt_date
start_date
supplier_address
supplier_city
supplier_name
tip_amount
total_amount
total_tax_amount
line_item

line_item/amount
line_item/description
line_item/product_code

Campos enriquecidos

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos enriquecidos

supplier_address
supplier_name
supplier_phone

Campos normalizados

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos normalizados

currency
total_amount
total_tax_amount
net_amount
receipt_date
purchase_time
start_date
end_date
line_item/amount
line_item/payment_date
line_item/payment_amount

Uptraining

Instruções de etiquetagem Abrir numa nova janela.

Ficheiro de entrada de exemplo Abrir numa nova janela.

Exemplo de saída Abrir numa nova janela.

Regiões suportadas

asia-southeast1
australia-southeast1
eu
northamerica-northeast1
us

Analisador de faturas

Descrição

Extraia texto e valores de faturas, como o número da fatura, o nome do fornecedor, o valor da fatura, o valor do imposto, a data da fatura e a data de vencimento.

O analisador de faturas extrai campos de cabeçalho e de itens de linha, como o número da fatura, o nome do fornecedor, o valor da fatura, o valor do imposto, a data da fatura, a data de vencimento e os valores dos itens de linha.

Categoria Pré-treinado

Funções OCR, extração de entidades

Fase de lançamento Disponibilidade geral

Estado de acesso Público

Escreva na API INVOICE_PROCESSOR

Idiomas suportados

Lista completa de idiomas

Nome do idioma	Etiqueta BCP 47	Script
Alemão	`de`	`Latn`
Inglês	`en`	`Latn`
Espanhol	`es`	`Latn`
Estónio	`et`	`Latn`
Francês	`fr`	`Latn`
Italiano	`it`	`Latn`
Letão	`lv`	`Latn`
Lituânia	`lt`	`Latn`
Neerlandês	`nl`	`Latn`
Português (Portugal e Brasil)	`pt`	`Latn`
Romeno	`ro`	`Latn`
Sueco	`sv`	`Latn`

Versões do processador

ID da versão	Libertar Canal	Idiomas adicionais suportados	Descrição
`pretrained-invoice-v1.1-2021-04-09`	Estável	Nenhum
`pretrained-invoice-v1.2-2022-02-18`	Estável	Nenhum	A descontinuação está planeada para breve.
`pretrained-invoice-v1.3-2022-07-15`	Estável	`it`: italiano `pt`: português (Portugal e Brasil) `ro`: romeno `sv`: sueco `et`: Estónio `lv`: letão `lt`: lituano	Versão do processador atualizável. O número máximo de páginas (pedidos online/síncronos) foi aumentado para 15.
`pretrained-invoice-v1.4-2022-10-21`	Candidato a lançamento	Nenhum	Versão do processador atualizável. O número máximo de páginas (pedidos online/síncronos) foi aumentado para 15.
`pretrained-invoice-v1.5-2023-09-15`	Candidato a lançamento	Nenhum
`pretrained-invoice-v2.0-2023-12-06`	Candidato a lançamento	Nenhum

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites

Número máximo de páginas (pedidos online/síncronos):	15
Número máximo de páginas (pedidos em lote/offline/assíncronos):	200
Número máximo de páginas (modo sem imagens online/pedidos síncronos):	30

Nota: para estender o limite máximo de páginas para pedidos online e síncronos até 30, certifique-se de que ativa imageless_mode no ProcessRequest.

Campos detetados na versão mais antiga

Também pode encontrar estas informações na página Campo detetado.

Lista completa de campos

amount_paid_since_last_invoice
carrier
currency
currency_exchange_rate
delivery_date
due_date
freight_amount
invoice_date
invoice_id
line_item

line_item/amount
line_item/description
line_item/product_code
line_item/purchase_order
line_item/quantity
line_item/unit
line_item/unit_price

net_amount
payment_terms
purchase_order
receiver_address
receiver_email
receiver_name
receiver_phone
receiver_tax_id
receiver_website
remit_to_address
remit_to_name
ship_from_address
ship_from_name
ship_to_address
ship_to_name
supplier_address
supplier_email
supplier_iban
supplier_name
supplier_payment_ref
supplier_phone
supplier_registration
supplier_tax_id
supplier_website
total_amount
total_tax_amount
vat

vat/amount
vat/category_code
vat/tax_amount
vat/tax_rate

Campos enriquecidos

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos enriquecidos

supplier_address
supplier_name
supplier_phone

Campos normalizados

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos normalizados

amount_paid_since_last_invoice
currency
currency_exchange_rate
delivery_date
due_date
freight_amount
invoice_date
net_amount
total_amount
total_tax_amount
line_item/amount
line_item/quantity
line_item/unit_price
vat/amount
vat/tax_amount
vat/tax_rate

Uptraining

Instruções de etiquetagem Abrir numa nova janela.

Ficheiro de entrada de exemplo Abrir numa nova janela.

Exemplo de saída Abrir numa nova janela.

Regiões suportadas

asia-south1
asia-southeast1
australia-southeast1
eu
northamerica-northeast1
us

Classifique documentos

Classificador personalizado

Descrição

Prepare um modelo para classificar um tipo de documento a partir de um conjunto de classes.

Categoria Classifique

Funções OCR, classificação

Fase de lançamento Disponibilidade geral

Estado de acesso Público

Escreva na API CUSTOM_CLASSIFICATION_PROCESSOR

Idiomas suportados

Nome do idioma	Etiqueta BCP 47	Script	Escrita manual suportada
Inglês	`en`	`Latn`

Versões do processador

ID da versão	Libertar Canal	Descrição
`pretrained-foundation-model-v1.4-2025-05-16`	Candidato a lançamento	Versão candidata com tecnologia do MDL/CE Gemini 2.0 Flash. Também inclui funcionalidades avançadas de ROC.
`pretrained-classifier-v1.5-2025-08-05`	Candidato a lançamento	Candidato a lançamento com tecnologia do MDL/CE Gemini 2.5 Flash. Também inclui funcionalidades avançadas de ROC.

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites

Número máximo de páginas (pedidos online/síncronos):	15
Número máximo de páginas (pedidos em lote/offline/assíncronos):	200
Número máximo de páginas (modo sem imagens online/pedidos síncronos):	30

Nota: para estender o limite máximo de páginas para pedidos online e síncronos até 30, certifique-se de que ativa imageless_mode no ProcessRequest.

Uptraining

Ficheiro de entrada de exemplo Abrir numa nova janela.

Exemplo de saída Abrir numa nova janela.

Regiões suportadas

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Mais informações Crie um processador de classificação personalizado

Divisor personalizado

Descrição

Prepare um modelo para dividir um ficheiro que contenha vários documentos em documentos individuais classificados.

Categoria Classifique

Funções OCR, classificação e divisão

Fase de lançamento Disponibilidade geral

Estado de acesso Público

Escreva na API CUSTOM_SPLITTING_PROCESSOR

Notes

A i18n só pode ser suportada através de opções de treino personalizadas.

Idiomas suportados

Nome do idioma	Etiqueta BCP 47	Script	Escrita manual suportada
Inglês	`en`	`Latn`

Quotas e limites

Número máximo de páginas (pedidos online/síncronos):	15
Número máximo de páginas (pedidos em lote/offline/assíncronos):	1000
Número máximo de páginas (modo sem imagens online/pedidos síncronos):	30

Nota: para estender o limite máximo de páginas para pedidos online e síncronos até 30, certifique-se de que ativa imageless_mode no ProcessRequest.

Uptraining

Ficheiro de entrada de exemplo Abrir numa nova janela.

Exemplo de saída Abrir numa nova janela.

Regiões suportadas

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Mais informações Crie um processador de divisão personalizado

Resuma documentos

Resumidor

Descrição

Receba resumos abstratos e com marcas de lista para documentos curtos e longos.

Categoria pré-treinado

Funções Resumir

Fase de lançamento Pré-visualização

Estado de acesso Público

Escreva na API SUMMARY_PROCESSOR

Idiomas suportados

Nome do idioma	Etiqueta BCP 47	Script	Escrita manual suportada
Inglês	`en`	`Latn`

Versões do processador

ID da versão	Libertar Canal	Descrição
`pretrained-foundation-model-v1.0-2023-08-22`	Estável	Modelo de base da Google

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites

Número máximo de páginas (pedidos online/síncronos):	15
Número máximo de páginas (pedidos em lote/offline/assíncronos):	250
Número máximo de páginas (modo sem imagens online/pedidos síncronos):	30

Nota: para estender o limite máximo de páginas para pedidos online e síncronos até 30, certifique-se de que ativa imageless_mode no ProcessRequest.

Uptraining

Ficheiro de entrada de exemplo Abrir numa nova janela.

Exemplo de saída Abrir numa nova janela.

Regiões suportadas

us

Mais informações Resumidor personalizado

Notas de rodapé

^[*] Este processador só está disponível para clientes com acesso limitado.

Para solicitar acesso à API, preencha e envie o formulário de solicitação do cliente de acesso limitado da IA Documental. O formulário pede informações sobre si, a sua empresa e o seu exemplo de utilização. Tenha em atenção que é necessário um ID do projeto do Google Cloud para aceder. Para criar um novo projeto do Google Cloud ou identificar o ID do projeto existente, consulte as seguintes instruções.

Depois de enviar o formulário, a equipa do Document AI vai rever a sua solicitação para garantir que cumpre os critérios de acesso. Se for aprovado, recebe um email com instruções sobre como aceder e usar esta funcionalidade.

^[†] A validação de documentos de identificação funciona para extrair e avaliar informações de documentos de identificação que contribuem para identificar se a imagem de entrada representa um ID autêntico.

Na Google Cloud, damos prioridade a ajudar os clientes a desenvolver e implementar soluções de IA em segurança, e a validação de identidade foi desenvolvida de acordo com os princípios de IA da Google.

Com base nos princípios de IA da Google e no design atual dos produtos, recomendamos vivamente que tenha cuidado e avalie cuidadosamente as potenciais vantagens e riscos da utilização da validação de documentos de identidade para o seguinte:

Tomada de decisões sem intervenção humana para previsões que podem afetar os direitos humanos.
Em domínios sensíveis, incluindo, entre outros, emprego, acesso a serviços públicos, cuidados de saúde e contextos críticos para a segurança.

^[‡] Use sempre a validação de identidade como parte do seu processo e fluxo de trabalho de deteção de identidade mais abrangentes. É importante ter um revisor humano no seu fluxo de trabalho para verificar se os sinais previstos são precisos. O processador de validação de identidade não se destina a substituir a revisão humana de IDs num fluxo de trabalho, mas sim a ajudar os revisores humanos na validação de documentos de identificação. O processador de validação de identidade não deve ser usado como uma ferramenta de decisão automática para determinar se um ID é válido. Com a revisão humana, os clientes podem alcançar uma maior precisão no processamento de documentos e ajudar as empresas a avaliar as previsões através de ferramentas criadas especificamente para permitir essas revisões.

Certifique-se de que revê os regulamentos na região onde está a implementar esta tecnologia e investiga as orientações existentes da indústria para saber mais acerca das diretrizes de políticas e dos problemas de equidade comuns. Leia acerca da equidade na aprendizagem automática, incluindo formas de mitigar a parcialidade em conjuntos de dados de preparação, avaliar os seus modelos personalizados quanto a disparidades no desempenho e outras considerações à medida que usa o seu modelo personalizado.

Incentivamos os clientes a terem em atenção a equidade, a interpretabilidade e as práticas recomendadas de privacidade e segurança ao implementar a validação de identidade. Para saber como implementar a IA responsável, leia as recomendações da Google para práticas de IA responsável.

Consulte a publicação no blogue Automatize o processamento de documentos de identidade com a Document AI] para ver mais informações sobre exemplos de utilização e um repositório de código de aplicação de exemplo.

Avançar

Ficheiros suportados

Lista de processadores Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Digitalize texto

Enterprise Document OCR (reconhecimento ótico de carateres)

Lista completa de idiomas

Extraia entidades de documentos

Extrator personalizado

Lista completa de idiomas

Lista completa de tipos de dados normalizados

Analisador de formulários

Lista completa de idiomas

Mostrar campos

Analisador de esquemas

Lista completa de idiomas

Explore processadores pré-formados

Analisador de extratos de conta

Lista completa de campos

Lista completa de campos enriquecidos

Lista completa de campos normalizados

Analisador W2

Mostrar campos

Mostrar campos

Mostrar campos

Lista completa de campos

Lista completa de campos enriquecidos

Analisador de passaportes dos EUA

Lista completa de campos

Lista completa de campos normalizados

Analisador de utilitários

Lista completa de campos

Lista completa de campos normalizados

Analisador de validação de documentos de identificação

Mostrar campos

Mostrar campos

Lista completa de campos

Lista completa de campos normalizados

Analisador de recibos de pagamento

Mostrar campos

Mostrar campos

Lista completa de campos

Lista completa de campos enriquecidos

Lista completa de campos normalizados

Analisador de cartas de condução dos EUA

Lista completa de campos

Lista completa de campos normalizados

Analisador de despesas

Lista completa de idiomas

Mostrar campos

Mostrar campos

Mostrar campos

Lista completa de campos

Lista completa de campos enriquecidos

Lista completa de campos normalizados

Analisador de faturas

Lista completa de idiomas

Lista completa de campos

Lista completa de campos enriquecidos

Lista completa de campos normalizados

Classifique documentos

Classificador personalizado

Divisor personalizado

Resuma documentos

Resumidor

Notas de rodapé

Lista de processadores