Esta página foi traduzida pela API Cloud Translation.

Lista de processadores

Esta página contém informações detalhadas sobre todos os processadores oferecidos pela Document AI. Confira uma lista de todos os processadores por tipo de solução.

Todos os processadores da Document AI obedecem aos Termos de segurança e tratamento de dados.

Consulte a documentação Como gerenciar versões do processador para mais detalhes. Além disso, limites específicos de processador se aplicam às cotas e limites gerais do produto.

Digitalizar texto

Enterprise Document OCR (reconhecimento óptico de caracteres)

Descrição

Identificar e extrair texto em diferentes tipos de documentos.

Esse processador permite identificar e extrair texto, incluindo texto escrito à mão, de documentos em mais de 200 idiomas. O processador também usa o aprendizado de máquina para fazer uma avaliação da qualidade de um documento com base na legibilidade do conteúdo.

Categoria Digitalizar

Funções OCR, análise de qualidade

Etapa de lançamento Disponibilidade geral

Status do acesso Pública

Digitar na API OCR_PROCESSOR

Idiomas disponíveis

Lista completa de idiomas

Nome do idioma	Tag BCP 47	Script
Africâner	`af`	`Latn`
Albanês	`sq`	`Latn`
Árabe	`ar`	`Arab`
Armênio	`hy`	`Armn`
Bielorrusso	`be`	`Cyrl`
Bengali	`bn`	`Beng`
Bengalês	`bn`	`Beng`
Búlgaro	`bg`	`Cyrl`
Catalão	`ca`	`Latn`
Chinês	`zh`	`Hani`
Croata	`hr`	`Latn`
Tcheco	`cs`	`Latn`
Dinamarquês	`da`	`Latn`
Holandês	`nl`	`Latn`
Inglês	`en`	`Latn`
Estoniano	`et`	`Latn`
Filipino	`fil`	`Latn`
Finlandês	`fi`	`Latn`
Francês	`fr`	`Latn`
Alemão	`de`	`Latn`
Grego	`el`	`Grek`
Gujarati	`gu`	`Gujr`
Hebraico	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Húngaro	`hu`	`Latn`
Islandês	`is`	`Latn`
Indonésio	`id`	`Latn`
Italiano	`it`	`Latn`
Japonês	`ja`	`Jpan`
Canarês	`kn`	`Knda`
Khmer	`km`	`Khmr`
Coreano	`ko`	`Kore`
Laosiano	`lo`	`Laoo`
Letão	`lv`	`Latn`
Lituano	`lt`	`Latn`
Macedônio	`mk`	`Cyrl`
Malaio	`ms`	`Latn`
Malaiala	`ml`	`Mlym`
Marati	`mr`	`Deva`
Nepalês	`ne`	`Deva`
Norueguês	`no`	`Latn`
Persa	`fa`	`Arab`
Polonês	`pl`	`Latn`
Português (Portugal e Brasil)	`pt`	`Latn`
Punjabi	`pa`	`Guru`
Romeno	`ro`	`Latn`
Russo	`ru`	`Cyrl`
Sérvio	`sr`	`Cyrl`
Eslovaco	`sk`	`Latn`
Esloveno	`sl`	`Latn`
Espanhol	`es`	`Latn`
Sueco	`sv`	`Latn`
Tagalo	`tl`	`Latn`
Tâmil	`ta`	`Taml`
Télugo	`te`	`Telu`
Tailandês	`th`	`Thai`
Turco	`tr`	`Latn`
Ucraniano	`uk`	`Cyrl`
Vietnamita	`vi`	`Latn`
Ídiche	`yi`	`Hebr`

Versões do processador

ID da versão	Canal de lançamento	Descrição
`pretrained-ocr-v1.2-2022-11-10`	Estável	Versão congelada do modelo v1.0: arquivos, configurações e binários de um snapshot de versão congelados em uma imagem de contêiner por até 18 meses.
`pretrained-ocr-v2.0-2023-06-02`	Estável	Modelo pronto para Production especializado em casos de uso de documentos. Inclui acesso a todos os complementos de OCR.
`pretrained-ocr-v2.1-2024-08-07`	Estável	As principais áreas de melhoria da v2.1 são: melhor reconhecimento de texto impresso, detecção mais precisa de caixas de seleção e ordem de leitura mais precisa.
`pretrained-ocr-v2.1.1-2025-01-31`	Versão candidata	A v2.1.1 é semelhante à v2.1 e está disponível em todas as regiões, exceto: `US`, `EU` e `asia-southeast1`.

Para mais informações, consulte Como gerenciar versões de processadores.

Cotas e limites

Máximo de páginas (solicitações on-line/síncronas):	15
Máximo de páginas (solicitações em lote/off-line/assíncronas):	500
Máximo de páginas (modo sem imagens on-line/solicitações síncronas):	30

Observação:para aumentar o limite máximo de páginas para solicitações on-line e síncronas até 30, ative imageless_mode em ProcessRequest.

Uptraining (em inglês)

Exemplo de arquivo de entrada Abrir em uma nova janela.

Exemplo de saída Abrir em uma nova janela.

Regiões com suporte

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Mais informações OCR de documentos corporativos

Extrair entidades dos documentos

Consulte Conjuntos de dados de amostra para ver exemplos rotulados e não rotulados que podem ser usados no treinamento.

Extrator personalizado

Descrição

Extraia campos de documentos usando IA generativa ou modelos personalizados e ajuste os modelos para extrair dados com precisão dos seus documentos.

Categoria Extrair

Funções OCR, extração de entidades

Etapa de lançamento Disponibilidade geral

Status do acesso Pública

Digitar na API CUSTOM_EXTRACTION_PROCESSOR

Observações

Se você usar a IA generativa para extração:
- No momento, apenas o idioma inglês é aceito.
- A disponibilidade por região está em US, EU, northamerica-northeast1 e asia-southeast1.

Idiomas disponíveis

Lista completa de idiomas

Nome do idioma	Tag BCP 47	Script
Africâner	`af`	`Latn`
Árabe	`ar`	`Arab`
Azerbaijano	`az`	`Latn`
Azerbaijano (cirílico)	`az-Cyrl`	`Cyrl`
Bielorrusso	`be`	`Cyrl`
Búlgaro	`bg`	`Cyrl`
Bósnio	`bs`	`Latn`
Catalão	`ca`	`Latn`
Cebuano	`ceb`	`Latn`
Tcheco	`cs`	`Latn`
Galês	`cy`	`Latn`
Dinamarquês	`da`	`Latn`
Alemão	`de`	`Latn`
Grego	`el`	`Grek`
Inglês	`en`	`Latn`
Esperanto	`eo`	`Latn`
Espanhol	`es`	`Latn`
Estoniano	`et`	`Latn`
Basco	`eu`	`Latn`
Persa	`fa`	`Arab`
Finlandês	`fi`	`Latn`
Filipino	`fil`	`Latn`
Francês	`fr`	`Latn`
Irlandês	`ga`	`Latn`
Galego	`gl`	`Latn`
Hindi	`hi`	`Deva`
Croata	`hr`	`Latn`
Crioulo haitiano	`ht`	`Latn`
Húngaro	`hu`	`Latn`
Indonésio	`id`	`Latn`
Islandês	`is`	`Latn`
Italiano	`it`	`Latn`
Hebraico	`iw`	`Hebr`
Japonês	`ja`	`Jpan`
Javanês	`jv`	`Latn`
Cazaque	`kk`	`Cyrl`
Coreano	`ko`	`Kore`
Quirguiz	`ky`	`Cyrl`
Latim	`la`	`Latn`
Lituano	`lt`	`Latn`
Letão	`lv`	`Latn`
Macedônio	`mk`	`Cyrl`
Mongol	`mn`	`Cyrl`
Marati	`mr`	`Deva`
Malaio	`ms`	`Latn`
Maltês	`mt`	`Latn`
Nepalês	`ne`	`Deva`
Holandês	`nl`	`Latn`
Norueguês	`no`	`Latn`
Polonês	`pl`	`Latn`
Pashto	`ps`	`Arab`
Português (Portugal e Brasil)	`pt`	`Latn`
Romeno	`ro`	`Latn`
Russo	`ru`	`Cyrl`
Russo (ortografia de Pedro, o Grande)	`ru-PETR1708`	`Cyrl`
Sânscrito	`sa`	`Deva`
Eslovaco	`sk`	`Latn`
Esloveno	`sl`	`Latn`
Albanês	`sq`	`Latn`
Sérvio	`sr`	`Cyrl`
Sueco	`sv`	`Latn`
Suaíli	`sw`	`Latn`
Tagalo	`tl`	`Latn`
Turco	`tr`	`Latn`
Ucraniano	`uk`	`Cyrl`
Urdu	`ur`	`Arab`
Usbeque	`uz`	`Latn`
Usbeque (cirílico)	`uz-Cyrl`	`Cyrl`
Vietnamita	`vi`	`Latn`
Ídiche	`yi`	`Hebr`
Chinês simplificado	`zh-Hans`	`Hani`
Chinês tradicional	`zh-Hant`	`Hani`
Zulu	`zu`	`Latn`

Versões do processador

ID da versão	Canal de lançamento	Descrição
`pretrained-foundation-model-v1.4-2025-02-05`	Estável	Modelo GA com tecnologia do LLM Gemini 2.0 Flash. Também inclui recursos avançados de OCR, como detecção de caixas de seleção.
`pretrained-foundation-model-v1.5-2025-05-05`	Estável	Candidato pronto para Production com tecnologia do LLM Gemini 2.5 Flash. Recomendado para quem quer testar modelos mais recentes.
`pretrained-foundation-model-v1.5-pro-2025-06-20`	Estável	Modelo pronto para Production com tecnologia do LLM Gemini 2.5 Pro. Suporta uma cota de até 30 páginas por minuto para solicitações de processo on-line. Esse modelo tem qualidade melhorada em comparação com a v1.5 e pode ter uma latência maior.

Para mais informações, consulte Como gerenciar versões de processadores.

Cotas e limites

Máximo de páginas (solicitações on-line/síncronas):	15
Máximo de páginas (solicitações em lote/off-line/assíncronas):	200
Máximo de páginas (modo sem imagens on-line/solicitações síncronas):	30

Observação:para aumentar o limite máximo de páginas para solicitações on-line e síncronas até 30, ative imageless_mode em ProcessRequest.

Tipos de dados normalizados

Para mais informações, consulte as páginas Enriquecimento e normalização e Criar conjunto de dados.

Lista completa de tipos de dados normalizados

dateTime as STRING
currency as STRING
money as google.type.Money
number as FLOAT or INTEGER

Uptraining (em inglês)

Exemplo de arquivo de entrada Abrir em uma nova janela.

Exemplo de saída Abrir em uma nova janela.

Regiões com suporte

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Mais informações Extrator personalizado

Analisador de formulários

Descrição

Extrair pares de chave-valor gerais (entidade e caixa de seleção), tabelas e entidades genéricas de documentos, além de texto de OCR.

Esse processador aplica tecnologias avançadas de aprendizado de máquina para extrair pares de chave-valor, caixas de seleção e tabelas de documentos em mais de 200 idiomas. Esse processador também usa modelos de aprendizado profundo para extrair 11 entidades genéricas comuns em vários tipos de documentos.

Categoria Extrair

Funções OCR, análise de formulários, extração de entidades

Etapa de lançamento Disponibilidade geral

Status do acesso Pública

Digitar na API FORM_PARSER_PROCESSOR

Idiomas disponíveis

Lista completa de idiomas

Nome do idioma	Tag BCP 47	Script
Africâner	`af`	`Latn`
Albanês	`sq`	`Latn`
Árabe	`ar`	`Arab`
Bielorrusso	`be`	`Cyrl`
Catalão	`ca`	`Latn`
Chinês	`zh`	`Hani`
Croata	`hr`	`Latn`
Tcheco	`cs`	`Latn`
Dinamarquês	`da`	`Latn`
Holandês	`nl`	`Latn`
Inglês	`en`	`Latn`
Estoniano	`et`	`Latn`
Filipino	`fil`	`Latn`
Finlandês	`fi`	`Latn`
Francês	`fr`	`Latn`
Alemão	`de`	`Latn`
Hebraico	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Húngaro	`hu`	`Latn`
Islandês	`is`	`Latn`
Indonésio	`id`	`Latn`
Italiano	`it`	`Latn`
Japonês	`ja`	`Jpan`
Coreano	`ko`	`Kore`
Letão	`lv`	`Latn`
Lituano	`lt`	`Latn`
Macedônio	`mk`	`Cyrl`
Malaio	`ms`	`Latn`
Marati	`mr`	`Deva`
Nepalês	`ne`	`Deva`
Norueguês	`no`	`Latn`
Persa	`fa`	`Arab`
Polonês	`pl`	`Latn`
Português (Portugal e Brasil)	`pt`	`Latn`
Romeno	`ro`	`Latn`
Russo	`ru`	`Cyrl`
Sérvio	`sr`	`Cyrl`
Eslovaco	`sk`	`Latn`
Esloveno	`sl`	`Latn`
Espanhol	`es`	`Latn`
Sueco	`sv`	`Latn`
Tagalo	`tl`	`Latn`
Turco	`tr`	`Latn`
Ucraniano	`uk`	`Cyrl`
Vietnamita	`vi`	`Latn`
Ídiche	`yi`	`Hebr`

Versões do processador

ID da versão	Canal de lançamento	Outros campos detectados	Descrição
`pretrained-form-parser-v1.0-2020-09-23`	Estável	Nenhum	Versão legada. Para ter a melhor qualidade e o conjunto completo de recursos, use o analisador de formulários v2.0.
`pretrained-form-parser-v2.0-2022-11-10`	Estável	Mostrar campos `email` `phone` `url` `date_time` `address` `person` `organization` `quantity` `price` `id` `page_number`	Versão recomendada. Suporta entidades genéricas e inclui modelo de tabela, KVP e caixa de seleção atualizados, além de mais de 200 idiomas.
`pretrained-form-parser-v2.1-2023-06-26`	Versão candidata a lançamento	Nenhum	Versão de pré-lançamento público. O mesmo modelo da v2.0 com a extração de texto nativa de arquivos PDF digitais ativada.

Para mais informações, consulte Como gerenciar versões de processadores.

Cotas e limites

Máximo de páginas (solicitações on-line/síncronas):	15
Máximo de páginas (solicitações em lote/off-line/assíncronas):	100
Máximo de páginas (modo sem imagens on-line/solicitações síncronas):	30

Observação:para aumentar o limite máximo de páginas para solicitações on-line e síncronas até 30, ative imageless_mode em ProcessRequest.

Uptraining (em inglês)

Exemplo de arquivo de entrada Abrir em uma nova janela.

Exemplo de saída Abrir em uma nova janela.

Regiões com suporte

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Mais informações Analisador de formulários

Analisador de layout

Descrição

Extrai elementos de conteúdo de documentos (texto, tabelas e listas) e cria blocos com reconhecimento de contexto.

O analisador de layout extrai elementos de conteúdo de documentos, como texto, tabelas e listas, e cria blocos com reconhecimento de contexto que facilitam a recuperação de informações em IA generativa e aplicativos de descoberta.

Categoria Extrair

Funções Análise de layout, divisão de documentos

Etapa de lançamento Disponibilidade geral

Status do acesso Pública

Digitar na API LAYOUT_PARSER_PROCESSOR

Observações

Esse analisador é compatível com arquivos PDF, HTML, DOCX, PPTX e XLSX/XLSM.

Idiomas disponíveis

Lista completa de idiomas

Nome do idioma	Tag BCP 47	Script
Africâner	`af`	`Latn`
Albanês	`sq`	`Latn`
Árabe	`ar`	`Arab`
Armênio	`hy`	`Armn`
Bielorrusso	`be`	`Cyrl`
Bengali	`bn`	`Beng`
Bengalês	`bn`	`Beng`
Búlgaro	`bg`	`Cyrl`
Catalão	`ca`	`Latn`
Chinês	`zh`	`Hani`
Croata	`hr`	`Latn`
Tcheco	`cs`	`Latn`
Dinamarquês	`da`	`Latn`
Holandês	`nl`	`Latn`
Inglês	`en`	`Latn`
Estoniano	`et`	`Latn`
Filipino	`fil`	`Latn`
Finlandês	`fi`	`Latn`
Francês	`fr`	`Latn`
Alemão	`de`	`Latn`
Grego	`el`	`Grek`
Gujarati	`gu`	`Gujr`
Hebraico	`iw`	`Hebr`
Hindi	`hi`	`Deva`
Húngaro	`hu`	`Latn`
Islandês	`is`	`Latn`
Indonésio	`id`	`Latn`
Italiano	`it`	`Latn`
Japonês	`ja`	`Jpan`
Canarês	`kn`	`Knda`
Khmer	`km`	`Khmr`
Coreano	`ko`	`Kore`
Laosiano	`lo`	`Laoo`
Letão	`lv`	`Latn`
Lituano	`lt`	`Latn`
Macedônio	`mk`	`Cyrl`
Malaio	`ms`	`Latn`
Malaiala	`ml`	`Mlym`
Marati	`mr`	`Deva`
Nepalês	`ne`	`Deva`
Norueguês	`no`	`Latn`
Persa	`fa`	`Arab`
Polonês	`pl`	`Latn`
Português (Portugal e Brasil)	`pt`	`Latn`
Punjabi	`pa`	`Guru`
Romeno	`ro`	`Latn`
Russo	`ru`	`Cyrl`
Sérvio	`sr`	`Cyrl`
Eslovaco	`sk`	`Latn`
Esloveno	`sl`	`Latn`
Espanhol	`es`	`Latn`
Sueco	`sv`	`Latn`
Tagalo	`tl`	`Latn`
Tâmil	`ta`	`Taml`
Télugo	`te`	`Telu`
Tailandês	`th`	`Thai`
Turco	`tr`	`Latn`
Ucraniano	`uk`	`Cyrl`
Vietnamita	`vi`	`Latn`
Ídiche	`yi`	`Hebr`

Versões do processador

ID da versão	Canal de lançamento	Descrição
`pretrained-layout-parser-v1.0-2024-06-03`	Estável	Versão recomendada.

Para mais informações, consulte Como gerenciar versões de processadores.

Cotas e limites

Máximo de páginas (solicitações on-line/síncronas):	15
Máximo de páginas (solicitações em lote/off-line/assíncronas):	500
Máximo de páginas (modo sem imagens on-line/solicitações síncronas):	30

Observação:para aumentar o limite máximo de páginas para solicitações on-line e síncronas até 30, ative imageless_mode em ProcessRequest.

Uptraining (em inglês)

Exemplo de arquivo de entrada Abrir em uma nova janela.

Exemplo de saída Abrir em uma nova janela.

Regiões com suporte

eu
us

Mais informações Analisador de layout

Conheça os processadores pré-treinados

Analisador de extrato bancário

Descrição

Dados extraídos de extratos bancários, incluindo nome, conta, transações etc.

Categoria Pré-treinado

Funções OCR, extração de entidades

Etapa de lançamento Disponibilidade geral

Status do acesso Pública

Digitar na API BANK_STATEMENT_PROCESSOR

Observações

Se uma página de um arquivo de entrada de várias páginas for o tipo de documento correto e uma das versões compatíveis, o processador vai realizar a extração de entidades no primeiro documento compatível. Se o processador não encontrar documentos aplicáveis no arquivo de entrada, ele vai retornar uma mensagem de erro.

Idiomas disponíveis

Nome do idioma	Tag BCP 47	Script	Suporte para escrita à mão
Inglês	`en`	`Latn`

Versões do processador

ID da versão	Canal de lançamento	Descrição
`pretrained-bankstatement-v1.0-2021-08-08`	Estável
`pretrained-bankstatement-v1.1-2021-08-13`	Estável
`pretrained-bankstatement-v2.0-2021-12-10`	Estável
`pretrained-bankstatement-v3.0-2022-05-16`	Estável	Esta versão pressupõe que o arquivo de entrada contém um único extrato bancário. Ao contrário da versão padrão, essa versão não verifica o arquivo de entrada em busca de extratos bancários e não retorna um erro se nenhum for encontrado.
`pretrained-bankstatement-v4.0-2023-07-31`	Versão candidata a lançamento
`pretrained-bankstatement-v5.0-2023-12-06`	Versão candidata a lançamento

Para mais informações, consulte Como gerenciar versões de processadores.

Cotas e limites

Máximo de páginas (solicitações on-line/síncronas):	15
Máximo de páginas (solicitações em lote/off-line/assíncronas):	30
Máximo de páginas (modo sem imagens on-line/solicitações síncronas):	30

Observação:para aumentar o limite máximo de páginas para solicitações on-line e síncronas até 30, ative imageless_mode em ProcessRequest.

Campos detectados na versão mais antiga

Você também pode encontrar essas informações na página Campo detectado.

Lista completa de campos

account_number
account_type
bank_address
bank_name
client_address
client_name
ending_balance
starting_balance
statement_date
statement_end_date
statement_start_date
table_item

table_item/transaction_deposit
table_item/transaction_deposit_date
table_item/transaction_deposit_description
table_item/transaction_withdrawal
table_item/transaction_withdrawal_date
table_item/transaction_withdrawal_description

Campos enriquecidos

Para mais informações, consulte a página Enriquecimento e normalização.

Lista completa de campos enriquecidos

bank_address
bank_name

Campos normalizados

Para mais informações, consulte a página Enriquecimento e normalização.

Lista completa de campos normalizados

ending_balance
starting_balance
statement_date
statement_end_date
statement_start_date
table_item/transaction_deposit
table_item/transaction_deposit_date
table_item/transaction_withdrawal
table_item/transaction_withdrawal_date

Uptraining (em inglês)

Instruções de rotulagem Abrir em uma nova janela.

Exemplo de arquivo de entrada Abrir em uma nova janela.

Exemplo de saída Abrir em uma nova janela.

Regiões com suporte

eu
us

Analisador W2

Descrição

Extrações do Formulário W2, incluindo funcionário, empregador, salário etc.

Categoria Pré-treinado

Funções OCR, extração de entidades

Etapa de lançamento Disponibilidade geral

Status do acesso Pública

Digitar na API FORM_W2_PROCESSOR

Observações

Se uma página de um arquivo de entrada de várias páginas for o tipo de documento correto e uma das versões compatíveis, o processador vai realizar a extração de entidades no primeiro documento compatível. Se o processador não encontrar documentos aplicáveis no arquivo de entrada, ele vai retornar uma mensagem de erro.

Idiomas disponíveis

Nome do idioma	Tag BCP 47	Script	Suporte para escrita à mão
Inglês	`en`	`Latn`

Formulários/versões compatíveis

2020 (versões padrão e personalizadas)
2019 (versões padrão e personalizadas)
2018 (versões padrão e personalizadas)

Versões do processador

ID da versão	Canal de lançamento	Outros campos detectados	Descrição
`pretrained-w2-v1.0-2020-10-01`	Estável	Nenhum
`pretrained-w2-v1.1-2022-01-27`	Estável	Nenhum
`pretrained-w2-v1.2-2022-01-28`	Estável	Mostrar campos `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress` `EmployeeName` `EmployerNameAndAddress` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalityName_Line1` `LocalWagesTipsEtc_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `SSN` `State_Line1` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `WagesTipsOtherCompensation`	Melhorias na qualidade e suporte a novos campos. Não inclui divisor.
`pretrained-w2-v2.0-2022-03-30`	Versão candidata a lançamento	Mostrar campos `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress_AdditionalStreetAddressOrPostalBox` `EmployeeAddress_City` `EmployeeAddress_State` `EmployeeAddress_StreetAddressOrPostalBox` `EmployeeAddress_Zip` `EmployeeName_FirstName` `EmployeeName_LastName` `EmployeeName_MiddleNameOrInitial` `EmployerAddress_AdditionalStreetAddressOrPostalBox` `EmployerAddress_City` `EmployerAddress_State` `EmployerAddress_StreetAddressOrPostalBox` `EmployerAddress_Zip` `EmployerName` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalWagesTipsEtc_Line1` `LocalityName_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SSN` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `State_Line1` `WagesTipsOtherCompensation` `a_Code` `a_Value` `b_Code` `b_Value` `c_Code` `c_Value` `d_Code` `d_Value`	Melhorias na qualidade e suporte para campos da caixa 12 e previsões refinadas de `EmployeeName`, `EmployeeAddress` e `EmployerNameAndAddress`, que não fazem mais parte da saída e foram substituídos por outros campos.
`pretrained-w2-v2.1-2022-06-08`	Estável	Mostrar campos `AllocatedTips` `ControlNumber` `DependentCareBenefits` `EIN` `EmployeeAddress_AdditionalStreetAddressOrPostalBox` `EmployeeAddress_City` `EmployeeAddress_State` `EmployeeAddress_StreetAddressOrPostalBox` `EmployeeAddress_Zip` `EmployeeName_FirstName` `EmployeeName_LastName` `EmployeeName_MiddleNameOrInitial` `EmployeeName_Suffix` `EmployerAddress_AdditionalStreetAddressOrPostalBox` `EmployerAddress_City` `EmployerAddress_State` `EmployerAddress_StreetAddressOrPostalBox` `EmployerAddress_Zip` `EmployerName` `EmployerStateIdNumber_Line1` `FederalIncomeTaxWithheld` `FormYear` `LocalIncomeTax_Line1` `LocalWagesTipsEtc_Line1` `LocalityName_Line1` `MedicareTaxWithheld` `MedicareWagesAndTips` `NonqualifiedPlans` `SSN` `SocialSecurityTaxWithheld` `SocialSecurityTips` `SocialSecurityWages` `StateIncomeTax_Line1` `StateWagesTipsEtc_Line1` `State_Line1` `WagesTipsOtherCompensation` `a_Code` `a_Value` `b_Code` `b_Value` `c_Code` `c_Value` `d_Code` `d_Value`	Semelhante à versão `pretrained-w2-v2.0-2022-03-30`, com mais melhorias de qualidade e a introdução de mais uma entidade `EmployeeName_Suffix`.

Para mais informações, consulte Como gerenciar versões de processadores.

Cotas e limites

Máximo de páginas (solicitações on-line/síncronas):	15
Máximo de páginas (solicitações em lote/off-line/assíncronas):	15
Máximo de páginas (modo sem imagens on-line/solicitações síncronas):	15

Observação:para aumentar o limite máximo de páginas para solicitações on-line e síncronas até 30, ative imageless_mode em ProcessRequest.

Campos detectados na versão mais antiga

Você também pode encontrar essas informações na página Campo detectado.

Lista completa de campos

ControlNumber
EIN
EmployeeAddress
EmployeeName
EmployerNameAndAddress
FederalIncomeTaxWithheld
MedicareTaxWithheld
MedicareWagesAndTips
SSN
SocialSecurityTaxWithheld
SocialSecurityWages
WagesTipsOtherCompensation

Campos enriquecidos

Para mais informações, consulte a página Enriquecimento e normalização.

Lista completa de campos enriquecidos

EmployerNameAndAddress
EIN

Uptraining (em inglês)

Exemplo de arquivo de entrada Abrir em uma nova janela.

Exemplo de saída Abrir em uma nova janela.

Regiões com suporte

eu
us

Analisador de passaportes dos EUA

Descrição

Extrair campos como nomes, IDs de documentos, data de nascimento etc.

Categoria Pré-treinado

Funções OCR, extração de entidades

Etapa de lançamento Disponibilidade geral

Status do acesso Pública

Digitar na API US_PASSPORT_PROCESSOR

Idiomas disponíveis

Nome do idioma	Tag BCP 47	Script	Suporte para escrita à mão
Inglês	`en`	`Latn`

Versões do processador

ID da versão	Canal de lançamento	Descrição
`pretrained-us-passport-v1.0-2021-06-14`	Estável

Para mais informações, consulte Como gerenciar versões de processadores.

Cotas e limites

Máximo de páginas (solicitações on-line/síncronas):	2
Máximo de páginas (solicitações em lote/off-line/assíncronas):	2
Máximo de páginas (modo sem imagens on-line/solicitações síncronas):	2

Observação:para aumentar o limite máximo de páginas para solicitações on-line e síncronas até 30, ative imageless_mode em ProcessRequest.

Campos detectados na versão mais antiga

Você também pode encontrar essas informações na página Campo detectado.

Lista completa de campos

Family Name
Given Names
Document Id
Expiration Date
Date Of Birth
Issue Date
MRZ Code
Portrait

Campos normalizados

Para mais informações, consulte a página Enriquecimento e normalização.

Lista completa de campos normalizados

Date Of Birth
Expiration Date
Issue Date

Uptraining (em inglês)

Exemplo de arquivo de entrada Abrir em uma nova janela.

Exemplo de saída Abrir em uma nova janela.

Regiões com suporte

eu
us

Analisador de utilitário

Descrição

Extraia textos e valores de contas de serviços públicos, como nome do fornecedor e valor pago anterior.

Categoria Pré-treinado

Funções OCR, extração de entidades

Etapa de lançamento Disponibilidade geral

Status do acesso Limitado ^[*]

Digitar na API UTILITY_PROCESSOR

Idiomas disponíveis

Nome do idioma	Tag BCP 47	Script	Suporte para escrita à mão
Inglês	`en`	`Latn`

Versões do processador

ID da versão	Canal de lançamento	Descrição
`pretrained-utility-v1.1-2021-04-09`	Estável
`pretrained-utility-v1.2-2022-12-15`	Versão candidata a lançamento

Para mais informações, consulte Como gerenciar versões de processadores.

Cotas e limites

Máximo de páginas (solicitações on-line/síncronas):	10
Máximo de páginas (solicitações em lote/off-line/assíncronas):	200
Máximo de páginas (modo sem imagens on-line/solicitações síncronas):	30

Observação:para aumentar o limite máximo de páginas para solicitações on-line e síncronas até 30, ative imageless_mode em ProcessRequest.

Campos detectados na versão mais antiga

Você também pode encontrar essas informações na página Campo detectado.

Lista completa de campos

adjusted_amount
amount_due
balance_transfer_amount
carrier
currency
currency_exchange_rate
delivery_date
deposit_credited_amount
due_date
freight_amount
invoice_date
invoice_id
late_fee_amount
line_item

line_item/amount
line_item/description
line_item/frequency
line_item/product_code
line_item/purchase_order
line_item/quantity
line_item/service_address
line_item/service_end_date
line_item/service_id_1
line_item/service_id_2
line_item/service_start_date
line_item/supplier_account_number
line_item/tax_amount
line_item/unit_number
line_item/unit_of_measure
line_item/unit_price
line_item/usage

net_amount
payment_terms
prior_amount_due
prior_paid_amount
purchase_order
receiver_address
receiver_email
receiver_name
receiver_phone
receiver_tax_id
receiver_website
reclaimed_water
remit_to_address
remit_to_name
service

service/service_end_date
service/service_id
service/service_start_date
service/unit_of_measure
service/usage

service_address
service_end_date
service_id
service_start_date
ship_from_address
ship_from_name
ship_to_address
ship_to_name
supplier_account_number
supplier_address
supplier_email
supplier_iban
supplier_name
supplier_payment_ref
supplier_phone
supplier_registration
supplier_tax_id
supplier_website
tampering
total_amount
total_tax_amount
usage
vat

vat/amount
vat/category_code
vat/tax_amount
vat/tax_rate

Campos normalizados

Para mais informações, consulte a página Enriquecimento e normalização.

Lista completa de campos normalizados

adjusted_amount
amount_due
balance_transfer_amount
currency
currency_exchange_rate
delivery_date
due_date
invoice_date
late_fee_amount
line_item/amount
line_item/quantity
line_item/tax_amount
line_item/unit_price
net_amount
prior_amount_due
prior_paid_amount
total_amount
total_tax_amount

Uptraining (em inglês)

Instruções de rotulagem Abrir em uma nova janela.

Exemplo de arquivo de entrada Abrir em uma nova janela.

Exemplo de saída Abrir em uma nova janela.

Regiões com suporte

eu
us

Analisador de comprovação de documento de identidade

Descrição

Prever a validade de documentos de ID usando vários indicadores.

O processador de comprovação de documento de identificação foi projetado para ajudar a prever a validade de documentos de ID com quatro indicadores diferentes.

No momento, o processador retorna informações dos seguintes indicadores:

Detecção de fraud_signals_is_identity_document: prevê se uma imagem contém um documento de identidade reconhecido.
Detecção de fraud_signals_suspicious_words: prevê se há palavras que não são típicas em IDs.
Detecção de fraud_signals_image_manipulation: prevê se a imagem foi alterada ou adulterada com uma ferramenta de edição de imagens.
fraud_signals_online_duplicate detection: prevê se a imagem pode ser encontrada on-line (somente nos EUA).

Categoria Pré-treinado

Funções OCR, análise de qualidade

Etapa de lançamento Disponibilidade geral

Status do acesso Pública

Digitar na API ID_PROOFING_PROCESSOR

Observações

No momento, o recurso de detecção de duplicidade on-line é processado em data centers dos EUA. O suporte regional e multirregional não está disponível para esse recurso fora dos EUA.
Esse processador é compatível com algoritmos que são atualizados com mais frequência do que as novas versões de processadores são lançadas. Por isso, o processador pode retornar resultados diferentes ao longo do tempo, mesmo usando a mesma versão. Por exemplo, o sistema de detecção de duplicados on-line monitora imagens presentes na Web. O comportamento do sistema pode mudar mais rapidamente do que pode ser rastreado nas versões do processador.
Consulte as observações sobre IA responsável^[†] e revisão humana.^[‡]

Idiomas disponíveis

Nome do idioma	Tag BCP 47	Script	Suporte para escrita à mão
Inglês	`en`	`Latn`

Formulários/versões compatíveis

Suporte para passaportes, cartões de passe e carteiras de habilitação dos EUA.

Versões do processador

ID da versão	Canal de lançamento	Outros campos detectados	Descrição
`pretrained-id-proofing-v1.0-2022-10-03`	Estável	Nenhum
`pretrained-id-proofing-v1.1-2023-05-18`	Versão candidata a lançamento	Mostrar campos `fraud_signals_photocopy_detection`	Sinal extra de detecção de fotocópia
`pretrained-id-proofing-v1.2-2023-10-04`	Versão candidata a lançamento	Mostrar campos `fraud_signals_photocopy_detection`

Para mais informações, consulte Como gerenciar versões de processadores.

Cotas e limites

Máximo de páginas (solicitações on-line/síncronas):	2
Máximo de páginas (solicitações em lote/off-line/assíncronas):	2
Máximo de páginas (modo sem imagens on-line/solicitações síncronas):	2

Observação:para aumentar o limite máximo de páginas para solicitações on-line e síncronas até 30, ative imageless_mode em ProcessRequest.

Campos detectados na versão mais antiga

Você também pode encontrar essas informações na página Campo detectado.

Lista completa de campos

fraud_signals_is_identity_document
fraud_signals_suspicious_words
evidence_suspicious_word
evidence_inconclusive_suspicious_word
fraud_signals_image_manipulation
fraud_signals_online_duplicate (US only)
fraud_signals_photocopy_detection
evidence_hostname (US only)
evidence_thumbnail_url (US only)

Campos normalizados

Para mais informações, consulte a página Enriquecimento e normalização.

Lista completa de campos normalizados

fraud_signals_image_manipulation
fraud_signals_online_duplicate (US only)
fraud_signals_is_identity_document
fraud_signals_suspicious_words

Uptraining (em inglês)

Exemplo de arquivo de entrada Abrir em uma nova janela.

Exemplo de saída Abrir em uma nova janela.

Regiões com suporte

eu
us

Analisador de holerite

Descrição

Extrações de recibos de pagamento, incluindo nome, empresa, valores etc.

Categoria Pré-treinado

Funções OCR, extração de entidades

Etapa de lançamento Disponibilidade geral

Status do acesso Pública

Digitar na API PAYSTUB_PROCESSOR

Observações

Se o documento de entrada de várias páginas tiver mais de um comprovante de pagamento válido, o processador vai extrair entidades apenas do primeiro comprovante válido. Se nenhum contracheque for encontrado no arquivo de entrada, o processador vai retornar uma mensagem de erro.

Idiomas disponíveis

Nome do idioma	Tag BCP 47	Script	Suporte para escrita à mão
Inglês	`en`	`Latn`

Versões do processador

ID da versão	Canal de lançamento	Outros campos detectados	Descrição
`pretrained-paystub-v1.0-2021-03-19`	Estável	Nenhum
`pretrained-paystub-v1.1-2021-08-13`	Estável	Mostrar campos `net_pay` `net_pay_ytd` `employee_account_number`	Melhoria da qualidade e suporte a novos campos
`pretrained-paystub-v1.2-2021-12-10`	Estável	Nenhum
`pretrained-paystub-v2.0-2022-05-17`	Versão candidata a lançamento	Mostrar campos `deduction_item` `deduction_item/deduction_type` `deduction_item/deduction_this_period` `deduction_item/deduction_ytd` `direct_deposit_item` `direct_deposit_item/direct_deposit` `direct_deposit_item/employee_account_number` `earning_item` `earning_item/earning_type` `earning_item/earning_rate` `earning_item/earning_hours` `earning_item/earning_this_period` `earning_item/earning_ytd` `page_number` `tax_item` `tax_item/tax_type` `tax_item/tax_this_period` `tax_item/tax_ytd` `federal_additional_tax` `federal_allowance` `federal_marital_status` `state_additional_tax` `state_allowance` `state_marital_status`	Esta versão pressupõe que o arquivo de entrada contém um único contracheque. Ao contrário da versão padrão, essa versão não verifica o arquivo de entrada em busca de contracheques e não retorna um erro se nenhum for encontrado. Melhoria na qualidade, suporte a novos campos e novo esquema. Os campos "Bônus", "Comissões", "Feriado", "Horas extras", "Salário normal" e "Férias" agora fazem parte de "earning_item/earning_this_period", e as versões do acumulado do ano estão em "earning_item/earning_ytd". O depósito direto e o número da conta do funcionário agora estão aninhados em direct_deposit_item. O limite de páginas assíncronas é 10.
`pretrained-paystub-v2.0-2022-07-22`	Estável	Nenhum	Melhorias na qualidade e no treinamento contínuo.
`pretrained-paystub-v3.0-2023-12-06`	Versão candidata a lançamento	Nenhum

Para mais informações, consulte Como gerenciar versões de processadores.

Cotas e limites

Máximo de páginas (solicitações on-line/síncronas):	15
Máximo de páginas (solicitações em lote/off-line/assíncronas):	50
Máximo de páginas (modo sem imagens on-line/solicitações síncronas):	30

Observação:para aumentar o limite máximo de páginas para solicitações on-line e síncronas até 30, ative imageless_mode em ProcessRequest.

Campos detectados na versão mais antiga

Você também pode encontrar essas informações na página Campo detectado.

Lista completa de campos

bonus
bonus_ytd
commissions
commissions_ytd
direct_deposit
employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
employee_address
employee_name
employer_address
employer_name
end_date
gross_earnings
gross_earnings_ytd
holiday
holiday_ytd
net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
overtime
overtime_ytd
pay_date
regular_pay
regular_pay_ytd
ssn
start_date
vacation
vacation_ytd

Campos enriquecidos

Para mais informações, consulte a página Enriquecimento e normalização.

Lista completa de campos enriquecidos

employer_address
employer_name

Campos normalizados

Para mais informações, consulte a página Enriquecimento e normalização.

Lista completa de campos normalizados

bonus
bonus_ytd
commissions
commissions_ytd
direct_deposit
end_date
gross_earnings
gross_earnings_ytd
holiday
holiday_ytd
net_pay
net_pay_ytd
overtime
overtime_ytd
pay_date
regular_pay
regular_pay_ytd
start_date
vacation
vacation_ytd

Uptraining (em inglês)

Instruções de rotulagem Abrir em uma nova janela.

Regiões com suporte

eu
us

Analisador de carteira de habilitação dos EUA

Descrição

Extrair campos como nomes, IDs de documentos, data de nascimento etc.

Categoria Pré-treinado

Funções OCR, extração de entidades

Etapa de lançamento Disponibilidade geral

Status do acesso Pública

Digitar na API US_DRIVER_LICENSE_PROCESSOR

Idiomas disponíveis

Nome do idioma	Tag BCP 47	Script	Suporte para escrita à mão
Inglês	`en`	`Latn`

Formulários/versões compatíveis

Suporta todos os 50 estados e DC.

Versões do processador

ID da versão	Canal de lançamento	Descrição
`pretrained-us-driver-license-v1.0-2021-06-14`	Estável

Para mais informações, consulte Como gerenciar versões de processadores.

Cotas e limites

Máximo de páginas (solicitações on-line/síncronas):	2
Máximo de páginas (solicitações em lote/off-line/assíncronas):	2
Máximo de páginas (modo sem imagens on-line/solicitações síncronas):	2

Observação:para aumentar o limite máximo de páginas para solicitações on-line e síncronas até 30, ative imageless_mode em ProcessRequest.

Campos detectados na versão mais antiga

Você também pode encontrar essas informações na página Campo detectado.

Lista completa de campos

Family Name
Given Names
Document Id
Expiration Date
Date Of Birth
Issue Date
Address
Portrait

Campos normalizados

Para mais informações, consulte a página Enriquecimento e normalização.

Lista completa de campos normalizados

Date Of Birth
Expiration Date
Issue Date

Uptraining (em inglês)

Exemplo de arquivo de entrada Abrir em uma nova janela.

Exemplo de saída Abrir em uma nova janela.

Regiões com suporte

eu
us

Analisador de despesas

Descrição

Extraia textos e valores de documentos de despesas, como data da despesa, nome do fornecedor, valor total e moeda.

Categoria Pré-treinado

Funções OCR, extração de entidades

Etapa de lançamento Disponibilidade geral

Status do acesso Pública

Digitar na API EXPENSE_PROCESSOR

Idiomas disponíveis

Lista completa de idiomas

Nome do idioma	Tag BCP 47	Script
Alemão	`de`	`Latn`
Inglês	`en`	`Latn`
Espanhol	`es`	`Latn`
Francês	`fr`	`Latn`
Japonês	`ja`	`Jpan`
Holandês	`nl`	`Latn`

Versões do processador

ID da versão	Canal de lançamento	Outros campos detectados	Outros idiomas disponíveis	Descrição
`pretrained-expense-v1.1-2021-04-09`	Estável	Nenhum	Nenhum	Lançado em abril de 2021.
`pretrained-expense-v1.3.2-2024-09-11`	Versão candidata a lançamento	Mostrar campos `credit_card_last_four_digits` `line_item/quantity` `payment_type`	`ja`: Japonês	Um upgrade para a v1.3 com um modelo de visão subjacente aprimorado.
`pretrained-expense-v1.4-2022-11-18`	Versão candidata a lançamento	Mostrar campos `traveler_name` `reservation_id` `line_item/transaction_date`	`ja`: Japonês `it`: italiano `pt`: português (Portugal e Brasil)	Melhorias no desempenho e suporte para uptraining. O limite máximo de páginas (solicitações on-line/síncronas) foi aumentado para 15. Observação:será descontinuado nos Estados Unidos (EUA) e na União Europeia (UE) a partir de 30 de abril de 2025.
`pretrained-expense-v1.4.2-2024-09-12`	Versão candidata a lançamento	Mostrar campos `traveler_name` `reservation_id` `line_item/transaction_date`	`ja`: Japonês `it`: italiano `pt`: português (Portugal e Brasil)	Um upgrade para a v1.4 com um modelo de visão aprimorado.

Para mais informações, consulte Como gerenciar versões de processadores.

Cotas e limites

Máximo de páginas (solicitações on-line/síncronas):	10
Máximo de páginas (solicitações em lote/off-line/assíncronas):	10
Máximo de páginas (modo sem imagens on-line/solicitações síncronas):	10

Observação:para aumentar o limite máximo de páginas para solicitações on-line e síncronas até 30, ative imageless_mode em ProcessRequest.

Campos detectados na versão mais antiga

Você também pode encontrar essas informações na página Campo detectado.

Lista completa de campos

credit_card_last_four_digits
currency
end_date
net_amount
payment_type
purchase_time
receipt_date
start_date
supplier_address
supplier_city
supplier_name
tip_amount
total_amount
total_tax_amount
line_item

line_item/amount
line_item/description
line_item/product_code

Campos enriquecidos

Para mais informações, consulte a página Enriquecimento e normalização.

Lista completa de campos enriquecidos

supplier_address
supplier_name
supplier_phone

Campos normalizados

Para mais informações, consulte a página Enriquecimento e normalização.

Lista completa de campos normalizados

currency
total_amount
total_tax_amount
net_amount
receipt_date
purchase_time
start_date
end_date
line_item/amount
line_item/payment_date
line_item/payment_amount

Uptraining (em inglês)

Instruções de rotulagem Abrir em uma nova janela.

Exemplo de arquivo de entrada Abrir em uma nova janela.

Exemplo de saída Abrir em uma nova janela.

Regiões com suporte

asia-southeast1
australia-southeast1
eu
northamerica-northeast1
us

Analisador de faturas

Descrição

Extrações de textos e valores de faturas, como número da fatura, nome do fornecedor, valor da fatura, valor fiscal, data da fatura e data de vencimento.

O analisador de faturas extrai campos de cabeçalho e itens de linha, como número da fatura, nome do fornecedor, valor da fatura, valor do tributo, data da fatura, data de vencimento e valores dos itens de linha.

Categoria Pré-treinado

Funções OCR, extração de entidades

Etapa de lançamento Disponibilidade geral

Status do acesso Pública

Digitar na API INVOICE_PROCESSOR

Idiomas disponíveis

Lista completa de idiomas

Nome do idioma	Tag BCP 47	Script
Alemão	`de`	`Latn`
Inglês	`en`	`Latn`
Espanhol	`es`	`Latn`
Estoniano	`et`	`Latn`
Francês	`fr`	`Latn`
Italiano	`it`	`Latn`
Letão	`lv`	`Latn`
Lituano	`lt`	`Latn`
Holandês	`nl`	`Latn`
Português (Portugal e Brasil)	`pt`	`Latn`
Romeno	`ro`	`Latn`
Sueco	`sv`	`Latn`

Versões do processador

ID da versão	Canal de lançamento	Outros idiomas disponíveis	Descrição
`pretrained-invoice-v1.1-2021-04-09`	Estável	Nenhum
`pretrained-invoice-v1.2-2022-02-18`	Estável	Nenhum	A descontinuação está prevista para breve.
`pretrained-invoice-v1.3-2022-07-15`	Estável	`it`: italiano `pt`: português (Portugal e Brasil) `ro`: romeno `sv`: sueco `et`: estoniano `lv`: letão `lt`: Lituano	Versão do processador que pode ser atualizada. O número máximo de páginas (solicitações on-line/síncronas) foi aumentado para 15.
`pretrained-invoice-v1.4-2022-10-21`	Versão candidata a lançamento	Nenhum	Versão do processador que pode ser atualizada. O número máximo de páginas (solicitações on-line/síncronas) foi aumentado para 15.
`pretrained-invoice-v1.5-2023-09-15`	Versão candidata a lançamento	Nenhum
`pretrained-invoice-v2.0-2023-12-06`	Versão candidata a lançamento	Nenhum

Para mais informações, consulte Como gerenciar versões de processadores.

Cotas e limites

Máximo de páginas (solicitações on-line/síncronas):	15
Máximo de páginas (solicitações em lote/off-line/assíncronas):	200
Máximo de páginas (modo sem imagens on-line/solicitações síncronas):	30

Observação:para aumentar o limite máximo de páginas para solicitações on-line e síncronas até 30, ative imageless_mode em ProcessRequest.

Campos detectados na versão mais antiga

Você também pode encontrar essas informações na página Campo detectado.

Lista completa de campos

amount_paid_since_last_invoice
carrier
currency
currency_exchange_rate
delivery_date
due_date
freight_amount
invoice_date
invoice_id
line_item

line_item/amount
line_item/description
line_item/product_code
line_item/purchase_order
line_item/quantity
line_item/unit
line_item/unit_price

net_amount
payment_terms
purchase_order
receiver_address
receiver_email
receiver_name
receiver_phone
receiver_tax_id
receiver_website
remit_to_address
remit_to_name
ship_from_address
ship_from_name
ship_to_address
ship_to_name
supplier_address
supplier_email
supplier_iban
supplier_name
supplier_payment_ref
supplier_phone
supplier_registration
supplier_tax_id
supplier_website
total_amount
total_tax_amount
vat

vat/amount
vat/category_code
vat/tax_amount
vat/tax_rate

Campos enriquecidos

Para mais informações, consulte a página Enriquecimento e normalização.

Lista completa de campos enriquecidos

supplier_address
supplier_name
supplier_phone

Campos normalizados

Para mais informações, consulte a página Enriquecimento e normalização.

Lista completa de campos normalizados

amount_paid_since_last_invoice
currency
currency_exchange_rate
delivery_date
due_date
freight_amount
invoice_date
net_amount
total_amount
total_tax_amount
line_item/amount
line_item/quantity
line_item/unit_price
vat/amount
vat/tax_amount
vat/tax_rate

Uptraining (em inglês)

Instruções de rotulagem Abrir em uma nova janela.

Exemplo de arquivo de entrada Abrir em uma nova janela.

Exemplo de saída Abrir em uma nova janela.

Regiões com suporte

asia-south1
asia-southeast1
australia-southeast1
eu
northamerica-northeast1
us

Classificar documentos

Classificador personalizado

Descrição

Treine um modelo para classificar um tipo de documento de um conjunto de classes.

Categoria Classificar

Funções OCR, classificação

Etapa de lançamento Disponibilidade geral

Status do acesso Pública

Digitar na API CUSTOM_CLASSIFICATION_PROCESSOR

Idiomas disponíveis

Nome do idioma	Tag BCP 47	Script	Suporte para escrita à mão
Inglês	`en`	`Latn`

Versões do processador

ID da versão	Canal de lançamento	Descrição
`pretrained-foundation-model-v1.4-2025-05-16`	Versão candidata a lançamento	Candidato a lançamento com tecnologia do LLM Gemini 2.0 Flash. Também inclui recursos avançados de OCR.
`pretrained-classifier-v1.5-2025-08-05`	Versão candidata a lançamento	Candidato a lançamento com tecnologia do LLM Gemini 2.5 Flash. Também inclui recursos avançados de OCR.

Para mais informações, consulte Como gerenciar versões de processadores.

Cotas e limites

Máximo de páginas (solicitações on-line/síncronas):	15
Máximo de páginas (solicitações em lote/off-line/assíncronas):	200
Máximo de páginas (modo sem imagens on-line/solicitações síncronas):	30

Observação:para aumentar o limite máximo de páginas para solicitações on-line e síncronas até 30, ative imageless_mode em ProcessRequest.

Uptraining (em inglês)

Exemplo de arquivo de entrada Abrir em uma nova janela.

Exemplo de saída Abrir em uma nova janela.

Regiões com suporte

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Mais informações Criar um processador de classificação personalizado

Divisor personalizado

Descrição

Treine um modelo para dividir um arquivo com vários documentos em documentos individuais e classificados.

Categoria Classificar

Funções OCR, classificação, divisão

Etapa de lançamento Disponibilidade geral

Status do acesso Pública

Digitar na API CUSTOM_SPLITTING_PROCESSOR

Observações

O i18n só pode ser compatível com opções de treinamento personalizadas.

Idiomas disponíveis

Nome do idioma	Tag BCP 47	Script	Suporte para escrita à mão
Inglês	`en`	`Latn`

Cotas e limites

Máximo de páginas (solicitações on-line/síncronas):	15
Máximo de páginas (solicitações em lote/off-line/assíncronas):	1000
Máximo de páginas (modo sem imagens on-line/solicitações síncronas):	30

Observação:para aumentar o limite máximo de páginas para solicitações on-line e síncronas até 30, ative imageless_mode em ProcessRequest.

Uptraining (em inglês)

Exemplo de arquivo de entrada Abrir em uma nova janela.

Exemplo de saída Abrir em uma nova janela.

Regiões com suporte

asia-south1
asia-southeast1
australia-southeast1
eu
europe-west2
europe-west3
northamerica-northeast1
us

Mais informações Criar um processador de divisão personalizada

Resumir documentos

Resumidor

Descrição

Receba resumos abstratos e em tópicos de documentos curtos e longos.

Categoria pré-treinado

Funções Resumir

Etapa de lançamento Visualizar

Status do acesso Pública

Digitar na API SUMMARY_PROCESSOR

Idiomas disponíveis

Nome do idioma	Tag BCP 47	Script	Suporte para escrita à mão
Inglês	`en`	`Latn`

Versões do processador

ID da versão	Canal de lançamento	Descrição
`pretrained-foundation-model-v1.0-2023-08-22`	Estável	Modelo de fundação do Google

Para mais informações, consulte Como gerenciar versões de processadores.

Cotas e limites

Máximo de páginas (solicitações on-line/síncronas):	15
Máximo de páginas (solicitações em lote/off-line/assíncronas):	250
Máximo de páginas (modo sem imagens on-line/solicitações síncronas):	30

Observação:para aumentar o limite máximo de páginas para solicitações on-line e síncronas até 30, ative imageless_mode em ProcessRequest.

Uptraining (em inglês)

Exemplo de arquivo de entrada Abrir em uma nova janela.

Exemplo de saída Abrir em uma nova janela.

Regiões com suporte

us

Mais informações Resumidor personalizado

Notas de rodapé

^[*] Este processador está disponível apenas para clientes com acesso limitado.

Para solicitar acesso à API, preencha e envie o formulário de solicitação de cliente de acesso limitado do Document AI. Nesse formulário, são solicitadas informações sobre você, sua empresa e seu caso de uso. É necessário ter um ID de projeto do Google Cloud para acessar. Para criar um novo projeto do Google Cloud ou identificar o ID do seu projeto atual, siga estas instruções.

Depois que você enviar o formulário, a equipe do Document AI analisará sua solicitação para garantir que você atenda aos critérios de acesso. Caso seja aprovado, você receberá um e-mail com instruções de como acessar e usar esse recurso.

^[†] A comprovação de documento de identidade extrai e avalia informações de documentos ID que ajudam a identificar se a imagem de entrada representa um ID autêntico.

No Google Cloud, priorizamos ajudar os clientes a desenvolver e implementar soluções de IA com segurança. A confirmação de identidade foi desenvolvida de acordo com os princípios de IA do Google.

Com base nos princípios de IA do Google e no design atual do produto, recomendamos cautela e avaliação cuidadosa dos possíveis benefícios e riscos de usar a comprovação de documento de identidade para:

Tomada de decisões sem um human in the loop para previsões que podem afetar os direitos humanos.
Em domínios sensíveis, incluindo, entre outros, emprego, acesso a serviços públicos, saúde e contextos críticos de segurança.

^[‡] Sempre use a comprovação de identidade como parte do seu processo e fluxo de trabalho mais amplos de detecção de identidade. É importante ter um revisor humano no seu fluxo de trabalho para verificar se os indicadores previstos são precisos. O processador de comprovação de identidade não foi criado para substituir a revisão humana de documentos de identificação em um fluxo de trabalho, mas sim para ajudar os revisores humanos a validar ID documentos. O processador de comprovação de identidade não deve ser usado como uma ferramenta de decisão automatizada para determinar se um ID é válido. Com a revisão humana, os clientes podem alcançar maior acurácia de processamento de documentos e ajudar as empresas a avaliar previsões usando ferramentas criadas especificamente para permitir essas revisões.

Analise a legislação na região em que você está implementando essa tecnologia e pesquise as orientações do setor para saber mais sobre as diretrizes da política e os problemas comuns de imparcialidade. Leia sobre imparcialidade no machine learning, incluindo maneiras de reduzir o viés em conjuntos de dados de treinamento, avaliar seus modelos personalizados para detectar disparidades no desempenho e outras considerações ao usar seu modelo personalizado.

Incentivamos os clientes a manter em mente as práticas recomendadas de imparcialidade, interpretabilidade, privacidade e segurança ao implementar a confirmação de identidade. Para saber mais sobre como implementar a IA responsável, leia as recomendações do Google para práticas de IA responsável.

Consulte a postagem do blog Automatizar o processamento de documentos de identidade com a Document AI para mais informações sobre casos de uso e um exemplo de repositório de código de aplicativo.

Avançar

Arquivos compatíveis

Lista de processadores Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Digitalizar texto

Enterprise Document OCR (reconhecimento óptico de caracteres)

Lista completa de idiomas

Extrair entidades dos documentos

Extrator personalizado

Lista completa de idiomas

Lista completa de tipos de dados normalizados

Analisador de formulários

Lista completa de idiomas

Mostrar campos

Analisador de layout

Lista completa de idiomas

Conheça os processadores pré-treinados

Analisador de extrato bancário

Lista completa de campos

Lista completa de campos enriquecidos

Lista completa de campos normalizados

Analisador W2

Mostrar campos

Mostrar campos

Mostrar campos

Lista completa de campos

Lista completa de campos enriquecidos

Analisador de passaportes dos EUA

Lista completa de campos

Lista completa de campos normalizados

Analisador de utilitário

Lista completa de campos

Lista completa de campos normalizados

Analisador de comprovação de documento de identidade

Mostrar campos

Mostrar campos

Lista completa de campos

Lista completa de campos normalizados

Analisador de holerite

Mostrar campos

Mostrar campos

Lista completa de campos

Lista completa de campos enriquecidos

Lista completa de campos normalizados

Analisador de carteira de habilitação dos EUA

Lista completa de campos

Lista completa de campos normalizados

Analisador de despesas

Lista completa de idiomas

Mostrar campos

Mostrar campos

Mostrar campos

Lista completa de campos

Lista completa de campos enriquecidos

Lista completa de campos normalizados

Analisador de faturas

Lista completa de idiomas

Lista completa de campos

Lista completa de campos enriquecidos

Lista completa de campos normalizados

Classificar documentos

Classificador personalizado

Divisor personalizado

Resumir documentos

Resumidor

Notas de rodapé

Lista de processadores