Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Esta página contém informações detalhadas sobre todos os processadores oferecidos pela
IA de documentos. Pode ver uma lista de todos os processadores por tipo de solução.
Enterprise Document OCR (reconhecimento ótico de carateres)
Descrição
Identificar e extrair texto em diferentes tipos de documentos.
Este processador permite-lhe identificar e extrair texto, incluindo texto manuscrito, de documentos em mais de 200 idiomas. O processador também usa a aprendizagem automática para fazer uma avaliação da qualidade de um documento com base na legibilidade do respetivo conteúdo.
Versão do modelo congelada da v1.0: ficheiros de modelo, configurações e binários de um resumo da versão congelado numa imagem de contentor durante um máximo de 18 meses.
pretrained-ocr-v2.0-2023-06-02
Estável
Modelo pronto para produção especializado em exemplos de utilização de documentos. Inclui acesso a todos os suplementos de OCR.
pretrained-ocr-v2.1-2024-08-07
Estável
As principais áreas de melhoria da versão 2.1 são: melhor reconhecimento de texto impresso, deteção mais precisa de caixas de verificação e ordem de leitura mais precisa.
pretrained-ocr-v2.1.1-2025-01-31
Candidato a lançamento
A versão 2.1.1 é semelhante à versão 2.1 e está disponível em todas as regiões, exceto: US, EU e asia-southeast1.
Consulte os conjuntos de dados de exemplo
para ver exemplos de conjuntos de dados etiquetados e não etiquetados que pode usar para a preparação.
Extrator personalizado
Descrição
Extraia campos de documentos através da IA generativa ou de modelos personalizados; ajuste os modelos para extrair dados com precisão dos seus documentos.
A disponibilidade regional está em US, EU, northamerica-northeast1 e asia-southeast1.
Idiomas suportados
Lista completa de idiomas
Nome do idioma
Etiqueta BCP 47
Script
Escrita manual suportada
Afrikaans
af
Latn
Árabe
ar
Arab
Azeri
az
Latn
Azerbaijano (cirílico)
az-Cyrl
Cyrl
Bielorrusso
be
Cyrl
Búlgaro
bg
Cyrl
Bósnio
bs
Latn
Catalão
ca
Latn
Cebuano
ceb
Latn
Chéquia
cs
Latn
Galês
cy
Latn
Dinamarquês
da
Latn
Alemão
de
Latn
Grego
el
Grek
Inglês
en
Latn
Esperanto
eo
Latn
Espanhol
es
Latn
Estónio
et
Latn
Basco
eu
Latn
Persa
fa
Arab
Finlandês
fi
Latn
Filipino
fil
Latn
Francês
fr
Latn
Irlandês
ga
Latn
Galego
gl
Latn
Hindi
hi
Deva
Croata
hr
Latn
Crioulo haitiano
ht
Latn
Húngaro
hu
Latn
Indonésio
id
Latn
Islandês
is
Latn
Italiano
it
Latn
Hebraico
iw
Hebr
Japonês
ja
Jpan
Javanês
jv
Latn
Cazaque
kk
Cyrl
Coreano
ko
Kore
Quirguize
ky
Cyrl
Latim
la
Latn
Lituânia
lt
Latn
Letão
lv
Latn
Macedónio
mk
Cyrl
Mongol
mn
Cyrl
Marati
mr
Deva
Malaio
ms
Latn
Maltês
mt
Latn
Nepalês
ne
Deva
Neerlandês
nl
Latn
Norueguês
no
Latn
Polaco
pl
Latn
Pastó
ps
Arab
Português (Portugal e Brasil)
pt
Latn
Romeno
ro
Latn
Russo
ru
Cyrl
Russo (ortografia petrina)
ru-PETR1708
Cyrl
Sânscrito
sa
Deva
Eslovaco
sk
Latn
Esloveno
sl
Latn
Albanês
sq
Latn
Sérvio
sr
Cyrl
Sueco
sv
Latn
Suaíli
sw
Latn
Tagalo
tl
Latn
Turco
tr
Latn
Ucraniano
uk
Cyrl
Urdu
ur
Arab
Usbeque
uz
Latn
Usbeque (cirílico)
uz-Cyrl
Cyrl
Vietnamita
vi
Latn
Iídiche
yi
Hebr
Chinês (simplificado)
zh-Hans
Hani
Chinês (tradicional)
zh-Hant
Hani
Zulu
zu
Latn
Versões do processador
ID da versão
Libertar Canal
Descrição
pretrained-foundation-model-v1.4-2025-02-05
Estável
Modelo de disponibilidade geral com tecnologia do MDL/CE Gemini 2.0 Flash. Também inclui funcionalidades de OCR avançadas, como a deteção de caixas de verificação.
pretrained-foundation-model-v1.5-2025-05-05
Estável
Candidato pronto para produção com tecnologia do MDL/CE Gemini 2.5 Flash. Recomendado para quem quer experimentar modelos mais recentes.
pretrained-foundation-model-v1.5-pro-2025-06-20
Estável
Modelo pronto para produção com tecnologia do MDL/CE Gemini 2.5 Pro. Suporta uma quota de até 30 páginas por minuto para pedidos de processos online. Este modelo tem uma qualidade melhorada em comparação com a v1.5 e pode ter uma latência mais elevada.
Extraia pares de chave-valor gerais (entidade e caixa de verificação), tabelas e entidades genéricas de documentos, além do texto de OCR.
Este processador aplica tecnologias de aprendizagem automática avançadas para extrair pares de chave-valor, caixas de verificação e tabelas de documentos em mais de 200 idiomas. Este processador também tira partido de modelos de aprendizagem profunda para extrair 11 entidades genéricas comuns em vários tipos de documentos.
Categoria
Extrair
Funções
OCR, análise de formulários e extração de entidades
Extrai elementos de conteúdo de documentos (texto, tabelas e listas) e cria blocos sensíveis ao contexto.
O Layout Parser extrai elementos de conteúdo de documentos, como texto, tabelas e listas, e cria blocos sensíveis ao contexto que facilitam a obtenção de informações em aplicações de IA generativa e de descoberta.
Se uma página de um ficheiro de entrada com várias páginas for o tipo de documento correto e uma das versões suportadas, o processador realiza a extração de entidades no primeiro documento suportado. Se o processador não encontrar documentos aplicáveis no ficheiro de entrada, devolve uma mensagem de erro.
Idiomas suportados
Nome do idioma
Etiqueta BCP 47
Script
Escrita manual suportada
Inglês
en
Latn
Versões do processador
ID da versão
Libertar Canal
Descrição
pretrained-bankstatement-v1.0-2021-08-08
Estável
pretrained-bankstatement-v1.1-2021-08-13
Estável
pretrained-bankstatement-v2.0-2021-12-10
Estável
pretrained-bankstatement-v3.0-2022-05-16
Estável
Esta versão pressupõe que o ficheiro de entrada contém um único extrato bancário. Ao contrário da versão predefinida, esta versão não verifica o ficheiro de entrada quanto a extratos de conta e não devolve um erro se não forem encontrados extratos de conta.
Se uma página de um ficheiro de entrada com várias páginas for o tipo de documento correto e uma das versões suportadas, o processador realiza a extração de entidades no primeiro documento suportado. Se o processador não encontrar documentos aplicáveis no ficheiro de entrada, devolve uma mensagem de erro.
Idiomas suportados
Nome do idioma
Etiqueta BCP 47
Script
Escrita manual suportada
Inglês
en
Latn
Formulário/versões suportados
2020 (versões padrão e personalizadas)
2019 (versões padrão e personalizadas)
2018 (versões padrão e personalizadas)
Versões do processador
ID da versão
Libertar Canal
Campos adicionais detetados
Descrição
pretrained-w2-v1.0-2020-10-01
Estável
Nenhum
pretrained-w2-v1.1-2022-01-27
Estável
Nenhum
pretrained-w2-v1.2-2022-01-28
Estável
Mostrar campos
AllocatedTips
ControlNumber
DependentCareBenefits
EIN
EmployeeAddress
EmployeeName
EmployerNameAndAddress
EmployerStateIdNumber_Line1
FederalIncomeTaxWithheld
FormYear
LocalIncomeTax_Line1
LocalityName_Line1
LocalWagesTipsEtc_Line1
MedicareTaxWithheld
MedicareWagesAndTips
NonqualifiedPlans
SocialSecurityTaxWithheld
SocialSecurityTips
SocialSecurityWages
SSN
State_Line1
StateIncomeTax_Line1
StateWagesTipsEtc_Line1
WagesTipsOtherCompensation
Melhorias de qualidade e suporte de novos campos; não inclui o separador.
Melhorias na qualidade e suporte para campos da caixa 12 e previsões detalhadas de EmployeeName, EmployeeAddress e EmployerNameAndAddress, que já não fazem parte do resultado e são substituídos por campos adicionais.
Analisador de validação de documentos de identificação
Descrição
Prever a validade de documentos de identificação através de vários sinais.
O processador de validação de documentos de identidade foi concebido para ajudar a prever a validade de documentos de identificação com quatro sinais diferentes.
Atualmente, o processador devolve informações dos seguintes sinais:
Deteção de fraud_signals_is_identity_document: prevê se uma imagem contém um documento de identificação reconhecido.
fraud_signals_suspicious_words deteção: prevê se existem palavras que não são típicas em IDs.
fraud_signals_image_manipulation deteção: prevê se a imagem foi alterada ou adulterada com uma ferramenta de edição de imagens.
fraud_signals_online_duplicate deteção: prevê se a imagem pode ser encontrada online (apenas nos EUA).
Atualmente, a funcionalidade de deteção de duplicados online é processada em centros de dados dos EUA. O suporte regional e multirregional não está disponível para esta funcionalidade fora dos EUA.
Este processador é suportado por algoritmos que são atualizados com mais frequência do que as novas versões do processador. Por este motivo, o processador pode devolver resultados diferentes ao longo do tempo, mesmo quando usa a mesma versão do processador. Por exemplo, o sistema de deteção de duplicados online monitoriza as imagens presentes na Web. O comportamento do sistema pode, então, mudar mais rapidamente do que o que pode ser monitorizado nas versões do processador.
Consulte as notas sobre a IA responsável[†] e a revisão humana.[‡]
Idiomas suportados
Nome do idioma
Etiqueta BCP 47
Script
Escrita manual suportada
Inglês
en
Latn
Formulário/versões suportados
Suporte para passaportes, cartões de passaporte e cartas de condução dos EUA.
Se o documento de entrada de várias páginas contiver mais do que um recibo de vencimento válido, o processador extrai entidades apenas do primeiro recibo de vencimento válido. Se não forem encontradas folhas de pagamento no ficheiro de entrada, o processador devolve uma mensagem de erro.
Idiomas suportados
Nome do idioma
Etiqueta BCP 47
Script
Escrita manual suportada
Inglês
en
Latn
Versões do processador
ID da versão
Libertar Canal
Campos adicionais detetados
Descrição
pretrained-paystub-v1.0-2021-03-19
Estável
Nenhum
pretrained-paystub-v1.1-2021-08-13
Estável
Mostrar campos
net_pay
net_pay_ytd
employee_account_number
Melhoria da qualidade e suporte de novos campos;
pretrained-paystub-v1.2-2021-12-10
Estável
Nenhum
pretrained-paystub-v2.0-2022-05-17
Candidato a lançamento
Mostrar campos
deduction_item
deduction_item/deduction_type
deduction_item/deduction_this_period
deduction_item/deduction_ytd
direct_deposit_item
direct_deposit_item/direct_deposit
direct_deposit_item/employee_account_number
earning_item
earning_item/earning_type
earning_item/earning_rate
earning_item/earning_hours
earning_item/earning_this_period
earning_item/earning_ytd
page_number
tax_item
tax_item/tax_type
tax_item/tax_this_period
tax_item/tax_ytd
federal_additional_tax
federal_allowance
federal_marital_status
state_additional_tax
state_allowance
state_marital_status
Esta versão pressupõe que o ficheiro de entrada contém um único recibo de vencimento. Ao contrário da versão predefinida, esta versão não verifica o ficheiro de entrada quanto a recibos de vencimento e não devolve um erro se não forem encontrados recibos de vencimento.
Melhoria da qualidade, suporte de novos campos e novo esquema. Os bónus, as comissões, os feriados, as horas extraordinárias, o salário normal e as férias fazem agora parte de earning_item/earning_this_period, e as respetivas versões desde o início do ano estão em earning_item/earning_ytd. O depósito direto e o número de conta do funcionário estão agora aninhados em direct_deposit_item.
O limite de páginas assíncronas é 10.
pretrained-paystub-v2.0-2022-07-22
Estável
Nenhum
Melhoria da qualidade e melhoramentos da atualização.
Extraia texto e valores de faturas, como o número da fatura, o nome do fornecedor, o valor da fatura, o valor do imposto, a data da fatura e a data de vencimento.
O analisador de faturas extrai campos de cabeçalho e de itens de linha, como o número da fatura, o nome do fornecedor, o valor da fatura, o valor do imposto, a data da fatura, a data de vencimento e os valores dos itens de linha.
[*] Este processador só está disponível para clientes com acesso limitado.
Para solicitar acesso à API, preencha e envie o
formulário de solicitação do cliente de acesso
limitado da IA Documental.
O formulário pede informações sobre si, a sua empresa e o seu exemplo de utilização.
Tenha em atenção que é necessário um ID do projeto do Google Cloud para aceder.
Para criar um novo projeto do Google Cloud ou identificar o ID do projeto existente, consulte as seguintes
instruções.
Depois de enviar o formulário, a equipa do Document AI vai rever a sua solicitação para garantir que cumpre os critérios de acesso.
Se for aprovado, recebe um email com instruções sobre como aceder
e usar esta funcionalidade.
[†]
A validação de documentos de identificação funciona para extrair e avaliar informações de documentos de identificação que contribuem para identificar se a imagem de entrada representa um ID autêntico.
Na Google Cloud, damos prioridade a ajudar os clientes a desenvolver e implementar soluções de IA em segurança, e a validação de identidade foi desenvolvida de acordo com os princípios de IA da Google.
Com base nos princípios de IA da Google e no design atual dos produtos, recomendamos vivamente que tenha cuidado e avalie cuidadosamente as potenciais vantagens e riscos da utilização da validação de documentos de identidade para o seguinte:
Tomada de decisões sem intervenção humana para previsões que podem afetar os direitos humanos.
Em domínios sensíveis, incluindo, entre outros, emprego, acesso a serviços públicos, cuidados de saúde e contextos críticos para a segurança.
[‡] Use sempre a validação de identidade como parte do seu processo e fluxo de trabalho de deteção de identidade mais abrangentes.
É importante ter um revisor humano no seu fluxo de trabalho para verificar se os sinais previstos são precisos. O processador de validação de identidade não se destina a substituir a revisão humana de IDs num fluxo de trabalho, mas sim a ajudar os revisores humanos na validação de documentos de identificação. O processador de validação de identidade não deve ser usado como uma ferramenta de decisão automática para determinar se um ID é válido. Com a revisão humana, os clientes podem alcançar uma maior precisão no processamento de documentos e ajudar as empresas a avaliar as previsões através de ferramentas criadas especificamente para permitir essas revisões.
Certifique-se de que revê os regulamentos na região onde está a implementar esta tecnologia e investiga as orientações existentes da indústria para saber mais acerca das diretrizes de políticas e dos problemas de equidade comuns. Leia acerca da equidade na aprendizagem automática, incluindo formas de mitigar a parcialidade em conjuntos de dados de preparação, avaliar os seus modelos personalizados quanto a disparidades no desempenho e outras considerações à medida que usa o seu modelo personalizado.
Incentivamos os clientes a terem em atenção a equidade, a interpretabilidade e as práticas recomendadas de privacidade e segurança ao implementar a validação de identidade. Para saber como implementar a IA responsável, leia as recomendações da Google para práticas de IA responsável.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-09-18 UTC."],[],[],null,[]]