Lista de processadores

Esta página contém informações detalhadas sobre todos os processadores oferecidos pela IA de documentos. Pode ver uma lista de todos os processadores por tipo de solução.

Todos os processadores do Document AI cumprem os Termos de Segurança e Tratamento de Dados.

Consulte a documentação sobre a gestão de versões do processador para ver mais detalhes. Além disso, aplicam-se limites específicos do processador, além das quotas e dos limites gerais do produto.

Digitalize texto

Enterprise Document OCR (reconhecimento ótico de carateres)

Descrição

Identificar e extrair texto em diferentes tipos de documentos.

Este processador permite-lhe identificar e extrair texto, incluindo texto manuscrito, de documentos em mais de 200 idiomas. O processador também usa a aprendizagem automática para fazer uma avaliação da qualidade de um documento com base na legibilidade do respetivo conteúdo.

Categoria Digitalize
Funções OCR, análise de qualidade
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Escreva na API OCR_PROCESSOR
Idiomas suportados
Lista completa de idiomas
Nome do idioma Etiqueta BCP 47 Script Escrita manual suportada
Afrikaans af Latn
Albanês sq Latn
Árabe ar Arab
Arménio hy Armn
Bielorrusso be Cyrl
Bengali bn Beng
Bengali bn Beng
Búlgaro bg Cyrl
Catalão ca Latn
Chinês zh Hani
Croata hr Latn
Chéquia cs Latn
Dinamarquês da Latn
Neerlandês nl Latn
Inglês en Latn
Estónio et Latn
Filipino fil Latn
Finlandês fi Latn
Francês fr Latn
Alemão de Latn
Grego el Grek
Gujarati gu Gujr
Hebraico iw Hebr
Hindi hi Deva
Húngaro hu Latn
Islandês is Latn
Indonésio id Latn
Italiano it Latn
Japonês ja Jpan
Canará kn Knda
Khmer km Khmr
Coreano ko Kore
Laosiano lo Laoo
Letão lv Latn
Lituânia lt Latn
Macedónio mk Cyrl
Malaio ms Latn
Malaiala ml Mlym
Marati mr Deva
Nepalês ne Deva
Norueguês no Latn
Persa fa Arab
Polaco pl Latn
Português (Portugal e Brasil) pt Latn
Punjabi pa Guru
Romeno ro Latn
Russo ru Cyrl
Sérvio sr Cyrl
Eslovaco sk Latn
Esloveno sl Latn
Espanhol es Latn
Sueco sv Latn
Tagalo tl Latn
Tamil ta Taml
Telugu te Telu
Tailandês th Thai
Turco tr Latn
Ucraniano uk Cyrl
Vietnamita vi Latn
Iídiche yi Hebr
Versões do processador
ID da versão Libertar Canal Descrição
pretrained-ocr-v1.2-2022-11-10 Estável Versão do modelo congelada da v1.0: ficheiros de modelo, configurações e binários de um resumo da versão congelado numa imagem de contentor durante um máximo de 18 meses.
pretrained-ocr-v2.0-2023-06-02 Estável Modelo pronto para produção especializado em exemplos de utilização de documentos. Inclui acesso a todos os suplementos de OCR.
pretrained-ocr-v2.1-2024-08-07 Estável As principais áreas de melhoria da versão 2.1 são: melhor reconhecimento de texto impresso, deteção mais precisa de caixas de verificação e ordem de leitura mais precisa.
pretrained-ocr-v2.1.1-2025-01-31 Candidato a lançamento A versão 2.1.1 é semelhante à versão 2.1 e está disponível em todas as regiões, exceto: US, EU e asia-southeast1.

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites
Número máximo de páginas (pedidos online/síncronos): 15
Número máximo de páginas (pedidos em lote/offline/assíncronos): 500
Número máximo de páginas (modo sem imagens online/pedidos síncronos): 30
Uptraining
Ficheiro de entrada de exemplo Abrir numa nova janela.
Exemplo de saída Abrir numa nova janela.
Regiões suportadas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Mais informações Enterprise Document OCR

Extraia entidades de documentos

Consulte os conjuntos de dados de exemplo para ver exemplos de conjuntos de dados etiquetados e não etiquetados que pode usar para a preparação.

Extrator personalizado

Descrição

Extraia campos de documentos através da IA generativa ou de modelos personalizados; ajuste os modelos para extrair dados com precisão dos seus documentos.

Categoria Extrair
Funções OCR, extração de entidades
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Escreva na API CUSTOM_EXTRACTION_PROCESSOR
Notes
  • Se usar a IA generativa para extração:

    • Apenas o idioma inglês é oficialmente suportado.
    • A disponibilidade regional está em US, EU, northamerica-northeast1 e asia-southeast1.

Idiomas suportados
Lista completa de idiomas
Nome do idioma Etiqueta BCP 47 Script Escrita manual suportada
Afrikaans af Latn
Árabe ar Arab
Azeri az Latn
Azerbaijano (cirílico) az-Cyrl Cyrl
Bielorrusso be Cyrl
Búlgaro bg Cyrl
Bósnio bs Latn
Catalão ca Latn
Cebuano ceb Latn
Chéquia cs Latn
Galês cy Latn
Dinamarquês da Latn
Alemão de Latn
Grego el Grek
Inglês en Latn
Esperanto eo Latn
Espanhol es Latn
Estónio et Latn
Basco eu Latn
Persa fa Arab
Finlandês fi Latn
Filipino fil Latn
Francês fr Latn
Irlandês ga Latn
Galego gl Latn
Hindi hi Deva
Croata hr Latn
Crioulo haitiano ht Latn
Húngaro hu Latn
Indonésio id Latn
Islandês is Latn
Italiano it Latn
Hebraico iw Hebr
Japonês ja Jpan
Javanês jv Latn
Cazaque kk Cyrl
Coreano ko Kore
Quirguize ky Cyrl
Latim la Latn
Lituânia lt Latn
Letão lv Latn
Macedónio mk Cyrl
Mongol mn Cyrl
Marati mr Deva
Malaio ms Latn
Maltês mt Latn
Nepalês ne Deva
Neerlandês nl Latn
Norueguês no Latn
Polaco pl Latn
Pastó ps Arab
Português (Portugal e Brasil) pt Latn
Romeno ro Latn
Russo ru Cyrl
Russo (ortografia petrina) ru-PETR1708 Cyrl
Sânscrito sa Deva
Eslovaco sk Latn
Esloveno sl Latn
Albanês sq Latn
Sérvio sr Cyrl
Sueco sv Latn
Suaíli sw Latn
Tagalo tl Latn
Turco tr Latn
Ucraniano uk Cyrl
Urdu ur Arab
Usbeque uz Latn
Usbeque (cirílico) uz-Cyrl Cyrl
Vietnamita vi Latn
Iídiche yi Hebr
Chinês (simplificado) zh-Hans Hani
Chinês (tradicional) zh-Hant Hani
Zulu zu Latn
Versões do processador
ID da versão Libertar Canal Descrição
pretrained-foundation-model-v1.4-2025-02-05 Estável Modelo de disponibilidade geral com tecnologia do MDL/CE Gemini 2.0 Flash. Também inclui funcionalidades de OCR avançadas, como a deteção de caixas de verificação.
pretrained-foundation-model-v1.5-2025-05-05 Estável Candidato pronto para produção com tecnologia do MDL/CE Gemini 2.5 Flash. Recomendado para quem quer experimentar modelos mais recentes.
pretrained-foundation-model-v1.5-pro-2025-06-20 Estável Modelo pronto para produção com tecnologia do MDL/CE Gemini 2.5 Pro. Suporta uma quota de até 30 páginas por minuto para pedidos de processos online. Este modelo tem uma qualidade melhorada em comparação com a v1.5 e pode ter uma latência mais elevada.

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites
Número máximo de páginas (pedidos online/síncronos): 15
Número máximo de páginas (pedidos em lote/offline/assíncronos): 200
Número máximo de páginas (modo sem imagens online/pedidos síncronos): 30
Tipos de dados normalizados

Pode encontrar mais informações nas páginas Enriquecimento e normalização e Criar conjunto de dados.

Lista completa de tipos de dados normalizados
  • dateTime as STRING
  • currency as STRING
  • money as google.type.Money
  • number as FLOAT or INTEGER
Uptraining
Ficheiro de entrada de exemplo Abrir numa nova janela.
Exemplo de saída Abrir numa nova janela.
Regiões suportadas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Mais informações Extrator personalizado

Analisador de formulários

Descrição

Extraia pares de chave-valor gerais (entidade e caixa de verificação), tabelas e entidades genéricas de documentos, além do texto de OCR.

Este processador aplica tecnologias de aprendizagem automática avançadas para extrair pares de chave-valor, caixas de verificação e tabelas de documentos em mais de 200 idiomas. Este processador também tira partido de modelos de aprendizagem profunda para extrair 11 entidades genéricas comuns em vários tipos de documentos.

Categoria Extrair
Funções OCR, análise de formulários e extração de entidades
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Escreva na API FORM_PARSER_PROCESSOR
Idiomas suportados
Lista completa de idiomas
Nome do idioma Etiqueta BCP 47 Script Escrita manual suportada
Afrikaans af Latn
Albanês sq Latn
Árabe ar Arab
Bielorrusso be Cyrl
Catalão ca Latn
Chinês zh Hani
Croata hr Latn
Chéquia cs Latn
Dinamarquês da Latn
Neerlandês nl Latn
Inglês en Latn
Estónio et Latn
Filipino fil Latn
Finlandês fi Latn
Francês fr Latn
Alemão de Latn
Hebraico iw Hebr
Hindi hi Deva
Húngaro hu Latn
Islandês is Latn
Indonésio id Latn
Italiano it Latn
Japonês ja Jpan
Coreano ko Kore
Letão lv Latn
Lituânia lt Latn
Macedónio mk Cyrl
Malaio ms Latn
Marati mr Deva
Nepalês ne Deva
Norueguês no Latn
Persa fa Arab
Polaco pl Latn
Português (Portugal e Brasil) pt Latn
Romeno ro Latn
Russo ru Cyrl
Sérvio sr Cyrl
Eslovaco sk Latn
Esloveno sl Latn
Espanhol es Latn
Sueco sv Latn
Tagalo tl Latn
Turco tr Latn
Ucraniano uk Cyrl
Vietnamita vi Latn
Iídiche yi Hebr
Versões do processador
ID da versão Libertar Canal Campos adicionais detetados Descrição
pretrained-form-parser-v1.0-2020-09-23 Estável

Nenhum

Versão antiga. Para obter a melhor qualidade e o conjunto completo de funcionalidades, use o analisador de formulários v2.0.
pretrained-form-parser-v2.0-2022-11-10 Estável
Mostrar campos
  • email
  • phone
  • url
  • date_time
  • address
  • person
  • organization
  • quantity
  • price
  • id
  • page_number
Versão recomendada. Suporta entidades genéricas e inclui um modelo de tabela, KVP e caixa de verificação atualizado, bem como mais de 200 idiomas.
pretrained-form-parser-v2.1-2023-06-26 Candidato a lançamento

Nenhum

Versão de pré-visualização pública. O mesmo modelo que a v2.0 com a extração de texto nativa de ficheiros PDF digitais ativada.

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites
Número máximo de páginas (pedidos online/síncronos): 15
Número máximo de páginas (pedidos em lote/offline/assíncronos): 100
Número máximo de páginas (modo sem imagens online/pedidos síncronos): 30
Uptraining
Ficheiro de entrada de exemplo Abrir numa nova janela.
Exemplo de saída Abrir numa nova janela.
Regiões suportadas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Mais informações Analisador de formulários

Analisador de esquemas

Descrição

Extrai elementos de conteúdo de documentos (texto, tabelas e listas) e cria blocos sensíveis ao contexto.

O Layout Parser extrai elementos de conteúdo de documentos, como texto, tabelas e listas, e cria blocos sensíveis ao contexto que facilitam a obtenção de informações em aplicações de IA generativa e de descoberta.

Categoria Extrair
Funções Análise de esquemas, divisão de documentos
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Escreva na API LAYOUT_PARSER_PROCESSOR
Notes
  • Este analisador suporta ficheiros PDF, HTML, DOCX, PPTX e XLSX/XLSM.
Idiomas suportados
Lista completa de idiomas
Nome do idioma Etiqueta BCP 47 Script Escrita manual suportada
Afrikaans af Latn
Albanês sq Latn
Árabe ar Arab
Arménio hy Armn
Bielorrusso be Cyrl
Bengali bn Beng
Bengali bn Beng
Búlgaro bg Cyrl
Catalão ca Latn
Chinês zh Hani
Croata hr Latn
Chéquia cs Latn
Dinamarquês da Latn
Neerlandês nl Latn
Inglês en Latn
Estónio et Latn
Filipino fil Latn
Finlandês fi Latn
Francês fr Latn
Alemão de Latn
Grego el Grek
Gujarati gu Gujr
Hebraico iw Hebr
Hindi hi Deva
Húngaro hu Latn
Islandês is Latn
Indonésio id Latn
Italiano it Latn
Japonês ja Jpan
Canará kn Knda
Khmer km Khmr
Coreano ko Kore
Laosiano lo Laoo
Letão lv Latn
Lituânia lt Latn
Macedónio mk Cyrl
Malaio ms Latn
Malaiala ml Mlym
Marati mr Deva
Nepalês ne Deva
Norueguês no Latn
Persa fa Arab
Polaco pl Latn
Português (Portugal e Brasil) pt Latn
Punjabi pa Guru
Romeno ro Latn
Russo ru Cyrl
Sérvio sr Cyrl
Eslovaco sk Latn
Esloveno sl Latn
Espanhol es Latn
Sueco sv Latn
Tagalo tl Latn
Tamil ta Taml
Telugu te Telu
Tailandês th Thai
Turco tr Latn
Ucraniano uk Cyrl
Vietnamita vi Latn
Iídiche yi Hebr
Versões do processador
ID da versão Libertar Canal Descrição
pretrained-layout-parser-v1.0-2024-06-03 Estável Versão recomendada.

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites
Número máximo de páginas (pedidos online/síncronos): 15
Número máximo de páginas (pedidos em lote/offline/assíncronos): 500
Número máximo de páginas (modo sem imagens online/pedidos síncronos): 30
Uptraining
Ficheiro de entrada de exemplo Abrir numa nova janela.
Exemplo de saída Abrir numa nova janela.
Regiões suportadas
  • eu
  • us
Mais informações Layout Parser

Explore processadores pré-formados

Analisador de extratos de conta

Descrição

Extrair informações de extratos bancários, incluindo nome, conta, transações, etc.

Categoria Pré-treinado
Funções OCR, extração de entidades
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Escreva na API BANK_STATEMENT_PROCESSOR
Notes
  • Se uma página de um ficheiro de entrada com várias páginas for o tipo de documento correto e uma das versões suportadas, o processador realiza a extração de entidades no primeiro documento suportado. Se o processador não encontrar documentos aplicáveis no ficheiro de entrada, devolve uma mensagem de erro.
Idiomas suportados
Nome do idioma Etiqueta BCP 47 Script Escrita manual suportada
Inglês en Latn
Versões do processador
ID da versão Libertar Canal Descrição
pretrained-bankstatement-v1.0-2021-08-08 Estável
pretrained-bankstatement-v1.1-2021-08-13 Estável
pretrained-bankstatement-v2.0-2021-12-10 Estável
pretrained-bankstatement-v3.0-2022-05-16 Estável Esta versão pressupõe que o ficheiro de entrada contém um único extrato bancário. Ao contrário da versão predefinida, esta versão não verifica o ficheiro de entrada quanto a extratos de conta e não devolve um erro se não forem encontrados extratos de conta.
pretrained-bankstatement-v4.0-2023-07-31 Candidato a lançamento
pretrained-bankstatement-v5.0-2023-12-06 Candidato a lançamento

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites
Número máximo de páginas (pedidos online/síncronos): 15
Número máximo de páginas (pedidos em lote/offline/assíncronos): 30
Número máximo de páginas (modo sem imagens online/pedidos síncronos): 30
Campos detetados na versão mais antiga

Também pode encontrar estas informações na página Campo detetado.

Lista completa de campos
  • account_number
  • account_type
  • bank_address
  • bank_name
  • client_address
  • client_name
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item
    • table_item/transaction_deposit
    • table_item/transaction_deposit_date
    • table_item/transaction_deposit_description
    • table_item/transaction_withdrawal
    • table_item/transaction_withdrawal_date
    • table_item/transaction_withdrawal_description
Campos enriquecidos

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos enriquecidos
  • bank_address
  • bank_name
Campos normalizados

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos normalizados
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item/transaction_deposit
  • table_item/transaction_deposit_date
  • table_item/transaction_withdrawal
  • table_item/transaction_withdrawal_date
Uptraining
Instruções de etiquetagem Abrir numa nova janela.
Ficheiro de entrada de exemplo Abrir numa nova janela.
Exemplo de saída Abrir numa nova janela.
Regiões suportadas
  • eu
  • us

Analisador W2

Descrição

Extrair do formulário W2, incluindo o funcionário, a entidade patronal, os salários, etc.

Categoria Pré-treinado
Funções OCR, extração de entidades
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Escreva na API FORM_W2_PROCESSOR
Notes
  • Se uma página de um ficheiro de entrada com várias páginas for o tipo de documento correto e uma das versões suportadas, o processador realiza a extração de entidades no primeiro documento suportado. Se o processador não encontrar documentos aplicáveis no ficheiro de entrada, devolve uma mensagem de erro.
Idiomas suportados
Nome do idioma Etiqueta BCP 47 Script Escrita manual suportada
Inglês en Latn
Formulário/versões suportados
  • 2020 (versões padrão e personalizadas)
  • 2019 (versões padrão e personalizadas)
  • 2018 (versões padrão e personalizadas)
Versões do processador
ID da versão Libertar Canal Campos adicionais detetados Descrição
pretrained-w2-v1.0-2020-10-01 Estável

Nenhum

pretrained-w2-v1.1-2022-01-27 Estável

Nenhum

pretrained-w2-v1.2-2022-01-28 Estável
Mostrar campos
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalityName_Line1
  • LocalWagesTipsEtc_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • SSN
  • State_Line1
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • WagesTipsOtherCompensation

Melhorias de qualidade e suporte de novos campos; não inclui o separador.

pretrained-w2-v2.0-2022-03-30 Candidato a lançamento
Mostrar campos
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

Melhorias na qualidade e suporte para campos da caixa 12 e previsões detalhadas de EmployeeName, EmployeeAddress e EmployerNameAndAddress, que já não fazem parte do resultado e são substituídos por campos adicionais.

pretrained-w2-v2.1-2022-06-08 Estável
Mostrar campos
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployeeName_Suffix
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

Semelhante à versão pretrained-w2-v2.0-2022-03-30, com melhorias de qualidade adicionais e a introdução de mais uma entidade EmployeeName_Suffix.

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites
Número máximo de páginas (pedidos online/síncronos): 15
Número máximo de páginas (pedidos em lote/offline/assíncronos): 15
Número máximo de páginas (modo sem imagens online/pedidos síncronos): 15
Campos detetados na versão mais antiga

Também pode encontrar estas informações na página Campo detetado.

Lista completa de campos
  • ControlNumber
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • FederalIncomeTaxWithheld
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityWages
  • WagesTipsOtherCompensation
Campos enriquecidos

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos enriquecidos
  • EmployerNameAndAddress
  • EIN
Uptraining
Ficheiro de entrada de exemplo Abrir numa nova janela.
Exemplo de saída Abrir numa nova janela.
Regiões suportadas
  • eu
  • us

Analisador de passaportes dos EUA

Descrição

Extrair campos como nomes, ID do documento, data de nascimento, etc.

Categoria Pré-treinado
Funções OCR, extração de entidades
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Escreva na API US_PASSPORT_PROCESSOR
Idiomas suportados
Nome do idioma Etiqueta BCP 47 Script Escrita manual suportada
Inglês en Latn
Versões do processador
ID da versão Libertar Canal Descrição
pretrained-us-passport-v1.0-2021-06-14 Estável

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites
Número máximo de páginas (pedidos online/síncronos): 2
Número máximo de páginas (pedidos em lote/offline/assíncronos): 2
Número máximo de páginas (modo sem imagens online/pedidos síncronos): 2
Campos detetados na versão mais antiga

Também pode encontrar estas informações na página Campo detetado.

Lista completa de campos
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • MRZ Code
  • Portrait
Campos normalizados

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos normalizados
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
Ficheiro de entrada de exemplo Abrir numa nova janela.
Exemplo de saída Abrir numa nova janela.
Regiões suportadas
  • eu
  • us

Analisador de utilitários

Descrição

Extrair texto e valores de faturas de serviços, como o nome do fornecedor e o valor pago anteriormente.

Categoria Pré-treinado
Funções OCR, extração de entidades
Fase de lançamento Disponibilidade geral
Estado de acesso Limitada [*]
Escreva na API UTILITY_PROCESSOR
Idiomas suportados
Nome do idioma Etiqueta BCP 47 Script Escrita manual suportada
Inglês en Latn
Versões do processador
ID da versão Libertar Canal Descrição
pretrained-utility-v1.1-2021-04-09 Estável
pretrained-utility-v1.2-2022-12-15 Candidato a lançamento

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites
Número máximo de páginas (pedidos online/síncronos): 10
Número máximo de páginas (pedidos em lote/offline/assíncronos): 200
Número máximo de páginas (modo sem imagens online/pedidos síncronos): 30
Campos detetados na versão mais antiga

Também pode encontrar estas informações na página Campo detetado.

Lista completa de campos
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • deposit_credited_amount
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • late_fee_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/frequency
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/service_address
    • line_item/service_end_date
    • line_item/service_id_1
    • line_item/service_id_2
    • line_item/service_start_date
    • line_item/supplier_account_number
    • line_item/tax_amount
    • line_item/unit_number
    • line_item/unit_of_measure
    • line_item/unit_price
    • line_item/usage
  • net_amount
  • payment_terms
  • prior_amount_due
  • prior_paid_amount
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • reclaimed_water
  • remit_to_address
  • remit_to_name
  • service
    • service/service_end_date
    • service/service_id
    • service/service_start_date
    • service/unit_of_measure
    • service/usage
  • service_address
  • service_end_date
  • service_id
  • service_start_date
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_account_number
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • tampering
  • total_amount
  • total_tax_amount
  • usage
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
Campos normalizados

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos normalizados
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • invoice_date
  • late_fee_amount
  • line_item/amount
  • line_item/quantity
  • line_item/tax_amount
  • line_item/unit_price
  • net_amount
  • prior_amount_due
  • prior_paid_amount
  • total_amount
  • total_tax_amount
Uptraining
Instruções de etiquetagem Abrir numa nova janela.
Ficheiro de entrada de exemplo Abrir numa nova janela.
Exemplo de saída Abrir numa nova janela.
Regiões suportadas
  • eu
  • us

Analisador de validação de documentos de identificação

Descrição

Prever a validade de documentos de identificação através de vários sinais.

O processador de validação de documentos de identidade foi concebido para ajudar a prever a validade de documentos de identificação com quatro sinais diferentes.

Atualmente, o processador devolve informações dos seguintes sinais:

  • Deteção de fraud_signals_is_identity_document: prevê se uma imagem contém um documento de identificação reconhecido.
  • fraud_signals_suspicious_words deteção: prevê se existem palavras que não são típicas em IDs.
  • fraud_signals_image_manipulation deteção: prevê se a imagem foi alterada ou adulterada com uma ferramenta de edição de imagens.
  • fraud_signals_online_duplicate deteção: prevê se a imagem pode ser encontrada online (apenas nos EUA).

Categoria Pré-treinado
Funções OCR, análise de qualidade
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Escreva na API ID_PROOFING_PROCESSOR
Notes
  • Atualmente, a funcionalidade de deteção de duplicados online é processada em centros de dados dos EUA. O suporte regional e multirregional não está disponível para esta funcionalidade fora dos EUA.
  • Este processador é suportado por algoritmos que são atualizados com mais frequência do que as novas versões do processador. Por este motivo, o processador pode devolver resultados diferentes ao longo do tempo, mesmo quando usa a mesma versão do processador. Por exemplo, o sistema de deteção de duplicados online monitoriza as imagens presentes na Web. O comportamento do sistema pode, então, mudar mais rapidamente do que o que pode ser monitorizado nas versões do processador.
  • Consulte as notas sobre a IA responsável[†] e a revisão humana.[‡]
Idiomas suportados
Nome do idioma Etiqueta BCP 47 Script Escrita manual suportada
Inglês en Latn
Formulário/versões suportados
  • Suporte para passaportes, cartões de passaporte e cartas de condução dos EUA.
Versões do processador
ID da versão Libertar Canal Campos adicionais detetados Descrição
pretrained-id-proofing-v1.0-2022-10-03 Estável

Nenhum

pretrained-id-proofing-v1.1-2023-05-18 Candidato a lançamento
Mostrar campos
  • fraud_signals_photocopy_detection

Sinal de deteção de fotocópia adicional

pretrained-id-proofing-v1.2-2023-10-04 Candidato a lançamento
Mostrar campos
  • fraud_signals_photocopy_detection

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites
Número máximo de páginas (pedidos online/síncronos): 2
Número máximo de páginas (pedidos em lote/offline/assíncronos): 2
Número máximo de páginas (modo sem imagens online/pedidos síncronos): 2
Campos detetados na versão mais antiga

Também pode encontrar estas informações na página Campo detetado.

Lista completa de campos
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
  • evidence_suspicious_word
  • evidence_inconclusive_suspicious_word
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_photocopy_detection
  • evidence_hostname (US only)
  • evidence_thumbnail_url (US only)
Campos normalizados

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos normalizados
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
Uptraining
Ficheiro de entrada de exemplo Abrir numa nova janela.
Exemplo de saída Abrir numa nova janela.
Regiões suportadas
  • eu
  • us

Analisador de recibos de pagamento

Descrição

Extrato de recibos de vencimento, incluindo nome, empresa, valores, etc.

Categoria Pré-treinado
Funções OCR, extração de entidades
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Escreva na API PAYSTUB_PROCESSOR
Notes
  • Se o documento de entrada de várias páginas contiver mais do que um recibo de vencimento válido, o processador extrai entidades apenas do primeiro recibo de vencimento válido. Se não forem encontradas folhas de pagamento no ficheiro de entrada, o processador devolve uma mensagem de erro.
Idiomas suportados
Nome do idioma Etiqueta BCP 47 Script Escrita manual suportada
Inglês en Latn
Versões do processador
ID da versão Libertar Canal Campos adicionais detetados Descrição
pretrained-paystub-v1.0-2021-03-19 Estável

Nenhum

pretrained-paystub-v1.1-2021-08-13 Estável
Mostrar campos
  • net_pay
  • net_pay_ytd
  • employee_account_number
Melhoria da qualidade e suporte de novos campos;
pretrained-paystub-v1.2-2021-12-10 Estável

Nenhum

pretrained-paystub-v2.0-2022-05-17 Candidato a lançamento
Mostrar campos
  • deduction_item
  • deduction_item/deduction_type
  • deduction_item/deduction_this_period
  • deduction_item/deduction_ytd
  • direct_deposit_item
  • direct_deposit_item/direct_deposit
  • direct_deposit_item/employee_account_number
  • earning_item
  • earning_item/earning_type
  • earning_item/earning_rate
  • earning_item/earning_hours
  • earning_item/earning_this_period
  • earning_item/earning_ytd
  • page_number
  • tax_item
  • tax_item/tax_type
  • tax_item/tax_this_period
  • tax_item/tax_ytd
  • federal_additional_tax
  • federal_allowance
  • federal_marital_status
  • state_additional_tax
  • state_allowance
  • state_marital_status

Esta versão pressupõe que o ficheiro de entrada contém um único recibo de vencimento. Ao contrário da versão predefinida, esta versão não verifica o ficheiro de entrada quanto a recibos de vencimento e não devolve um erro se não forem encontrados recibos de vencimento.

Melhoria da qualidade, suporte de novos campos e novo esquema. Os bónus, as comissões, os feriados, as horas extraordinárias, o salário normal e as férias fazem agora parte de earning_item/earning_this_period, e as respetivas versões desde o início do ano estão em earning_item/earning_ytd. O depósito direto e o número de conta do funcionário estão agora aninhados em direct_deposit_item.

O limite de páginas assíncronas é 10.

pretrained-paystub-v2.0-2022-07-22 Estável

Nenhum

Melhoria da qualidade e melhoramentos da atualização.

pretrained-paystub-v3.0-2023-12-06 Candidato a lançamento

Nenhum

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites
Número máximo de páginas (pedidos online/síncronos): 15
Número máximo de páginas (pedidos em lote/offline/assíncronos): 50
Número máximo de páginas (modo sem imagens online/pedidos síncronos): 30
Campos detetados na versão mais antiga

Também pode encontrar estas informações na página Campo detetado.

Lista completa de campos
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
  • employee_address
  • employee_name
  • employer_address
  • employer_name
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
  • net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • ssn
  • start_date
  • vacation
  • vacation_ytd
Campos enriquecidos

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos enriquecidos
  • employer_address
  • employer_name
Campos normalizados

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos normalizados
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay
  • net_pay_ytd
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • start_date
  • vacation
  • vacation_ytd
Uptraining
Instruções de etiquetagem Abrir numa nova janela.
Regiões suportadas
  • eu
  • us

Analisador de cartas de condução dos EUA

Descrição

Extrair campos como nomes, ID do documento, data de nascimento, etc.

Categoria Pré-treinado
Funções OCR, extração de entidades
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Escreva na API US_DRIVER_LICENSE_PROCESSOR
Idiomas suportados
Nome do idioma Etiqueta BCP 47 Script Escrita manual suportada
Inglês en Latn
Formulário/versões suportados
  • Suporta todos os 50 estados e o Distrito de Columbia
Versões do processador
ID da versão Libertar Canal Descrição
pretrained-us-driver-license-v1.0-2021-06-14 Estável

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites
Número máximo de páginas (pedidos online/síncronos): 2
Número máximo de páginas (pedidos em lote/offline/assíncronos): 2
Número máximo de páginas (modo sem imagens online/pedidos síncronos): 2
Campos detetados na versão mais antiga

Também pode encontrar estas informações na página Campo detetado.

Lista completa de campos
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • Address
  • Portrait
Campos normalizados

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos normalizados
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
Ficheiro de entrada de exemplo Abrir numa nova janela.
Exemplo de saída Abrir numa nova janela.
Regiões suportadas
  • eu
  • us

Analisador de despesas

Descrição

Extrair texto e valores de documentos de despesas, como a data da despesa, o nome do fornecedor, o valor total e a moeda.

Categoria Pré-treinado
Funções OCR, extração de entidades
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Escreva na API EXPENSE_PROCESSOR
Idiomas suportados
Lista completa de idiomas
Nome do idioma Etiqueta BCP 47 Script Escrita manual suportada
Alemão de Latn
Inglês en Latn
Espanhol es Latn
Francês fr Latn
Japonês ja Jpan
Neerlandês nl Latn
Versões do processador
ID da versão Libertar Canal Campos adicionais detetados Idiomas adicionais suportados Descrição
pretrained-expense-v1.1-2021-04-09 Estável

Nenhum

Nenhum

Lançado em abril de 2021.
pretrained-expense-v1.3.2-2024-09-11 Candidato a lançamento
Mostrar campos
  • credit_card_last_four_digits
  • line_item/quantity
  • payment_type
  • ja: japonês
Uma atualização para a v1.3 com um modelo de visão subjacente melhorado.
pretrained-expense-v1.4-2022-11-18 Candidato a lançamento
Mostrar campos
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: japonês
  • it: italiano
  • pt: português (Portugal e Brasil)
Melhorias no desempenho e suporte para atualizações. O limite máximo de páginas (pedidos online/síncronos) foi aumentado para 15.
pretrained-expense-v1.4.2-2024-09-12 Candidato a lançamento
Mostrar campos
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: japonês
  • it: italiano
  • pt: português (Portugal e Brasil)
Uma atualização para a v1.4 com um modelo de visão subjacente melhorado.

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites
Número máximo de páginas (pedidos online/síncronos): 10
Número máximo de páginas (pedidos em lote/offline/assíncronos): 10
Número máximo de páginas (modo sem imagens online/pedidos síncronos): 10
Campos detetados na versão mais antiga

Também pode encontrar estas informações na página Campo detetado.

Lista completa de campos
  • credit_card_last_four_digits
  • currency
  • end_date
  • net_amount
  • payment_type
  • purchase_time
  • receipt_date
  • start_date
  • supplier_address
  • supplier_city
  • supplier_name
  • tip_amount
  • total_amount
  • total_tax_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
Campos enriquecidos

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos enriquecidos
  • supplier_address
  • supplier_name
  • supplier_phone
Campos normalizados

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos normalizados
  • currency
  • total_amount
  • total_tax_amount
  • net_amount
  • receipt_date
  • purchase_time
  • start_date
  • end_date
  • line_item/amount
  • line_item/payment_date
  • line_item/payment_amount
Uptraining
Instruções de etiquetagem Abrir numa nova janela.
Ficheiro de entrada de exemplo Abrir numa nova janela.
Exemplo de saída Abrir numa nova janela.
Regiões suportadas
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Analisador de faturas

Descrição

Extraia texto e valores de faturas, como o número da fatura, o nome do fornecedor, o valor da fatura, o valor do imposto, a data da fatura e a data de vencimento.

O analisador de faturas extrai campos de cabeçalho e de itens de linha, como o número da fatura, o nome do fornecedor, o valor da fatura, o valor do imposto, a data da fatura, a data de vencimento e os valores dos itens de linha.

Categoria Pré-treinado
Funções OCR, extração de entidades
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Escreva na API INVOICE_PROCESSOR
Idiomas suportados
Lista completa de idiomas
Nome do idioma Etiqueta BCP 47 Script Escrita manual suportada
Alemão de Latn
Inglês en Latn
Espanhol es Latn
Estónio et Latn
Francês fr Latn
Italiano it Latn
Letão lv Latn
Lituânia lt Latn
Neerlandês nl Latn
Português (Portugal e Brasil) pt Latn
Romeno ro Latn
Sueco sv Latn
Versões do processador
ID da versão Libertar Canal Idiomas adicionais suportados Descrição
pretrained-invoice-v1.1-2021-04-09 Estável

Nenhum

pretrained-invoice-v1.2-2022-02-18 Estável

Nenhum

A descontinuação está planeada para breve.
pretrained-invoice-v1.3-2022-07-15 Estável
  • it: italiano
  • pt: português (Portugal e Brasil)
  • ro: romeno
  • sv: sueco
  • et: Estónio
  • lv: letão
  • lt: lituano
Versão do processador atualizável. O número máximo de páginas (pedidos online/síncronos) foi aumentado para 15.
pretrained-invoice-v1.4-2022-10-21 Candidato a lançamento

Nenhum

Versão do processador atualizável. O número máximo de páginas (pedidos online/síncronos) foi aumentado para 15.
pretrained-invoice-v1.5-2023-09-15 Candidato a lançamento

Nenhum

pretrained-invoice-v2.0-2023-12-06 Candidato a lançamento

Nenhum

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites
Número máximo de páginas (pedidos online/síncronos): 15
Número máximo de páginas (pedidos em lote/offline/assíncronos): 200
Número máximo de páginas (modo sem imagens online/pedidos síncronos): 30
Campos detetados na versão mais antiga

Também pode encontrar estas informações na página Campo detetado.

Lista completa de campos
  • amount_paid_since_last_invoice
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/unit
    • line_item/unit_price
  • net_amount
  • payment_terms
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • remit_to_address
  • remit_to_name
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • total_amount
  • total_tax_amount
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
Campos enriquecidos

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos enriquecidos
  • supplier_address
  • supplier_name
  • supplier_phone
Campos normalizados

Pode encontrar mais informações na página Enriquecimento e normalização.

Lista completa de campos normalizados
  • amount_paid_since_last_invoice
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • net_amount
  • total_amount
  • total_tax_amount
  • line_item/amount
  • line_item/quantity
  • line_item/unit_price
  • vat/amount
  • vat/tax_amount
  • vat/tax_rate
Uptraining
Instruções de etiquetagem Abrir numa nova janela.
Ficheiro de entrada de exemplo Abrir numa nova janela.
Exemplo de saída Abrir numa nova janela.
Regiões suportadas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Classifique documentos

Classificador personalizado

Descrição

Prepare um modelo para classificar um tipo de documento a partir de um conjunto de classes.

Categoria Classifique
Funções OCR, classificação
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Escreva na API CUSTOM_CLASSIFICATION_PROCESSOR
Idiomas suportados
Nome do idioma Etiqueta BCP 47 Script Escrita manual suportada
Inglês en Latn
Versões do processador
ID da versão Libertar Canal Descrição
pretrained-foundation-model-v1.4-2025-05-16 Candidato a lançamento Versão candidata com tecnologia do MDL/CE Gemini 2.0 Flash. Também inclui funcionalidades avançadas de ROC.
pretrained-classifier-v1.5-2025-08-05 Candidato a lançamento Candidato a lançamento com tecnologia do MDL/CE Gemini 2.5 Flash. Também inclui funcionalidades avançadas de ROC.

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites
Número máximo de páginas (pedidos online/síncronos): 15
Número máximo de páginas (pedidos em lote/offline/assíncronos): 200
Número máximo de páginas (modo sem imagens online/pedidos síncronos): 30
Uptraining
Ficheiro de entrada de exemplo Abrir numa nova janela.
Exemplo de saída Abrir numa nova janela.
Regiões suportadas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Mais informações Crie um processador de classificação personalizado

Divisor personalizado

Descrição

Prepare um modelo para dividir um ficheiro que contenha vários documentos em documentos individuais classificados.

Categoria Classifique
Funções OCR, classificação e divisão
Fase de lançamento Disponibilidade geral
Estado de acesso Público
Escreva na API CUSTOM_SPLITTING_PROCESSOR
Notes
  • A i18n só pode ser suportada através de opções de treino personalizadas.
Idiomas suportados
Nome do idioma Etiqueta BCP 47 Script Escrita manual suportada
Inglês en Latn
Quotas e limites
Número máximo de páginas (pedidos online/síncronos): 15
Número máximo de páginas (pedidos em lote/offline/assíncronos): 1000
Número máximo de páginas (modo sem imagens online/pedidos síncronos): 30
Uptraining
Ficheiro de entrada de exemplo Abrir numa nova janela.
Exemplo de saída Abrir numa nova janela.
Regiões suportadas
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Mais informações Crie um processador de divisão personalizado

Resuma documentos

Resumidor

Descrição

Receba resumos abstratos e com marcas de lista para documentos curtos e longos.

Categoria pré-treinado
Funções Resumir
Fase de lançamento Pré-visualização
Estado de acesso Público
Escreva na API SUMMARY_PROCESSOR
Idiomas suportados
Nome do idioma Etiqueta BCP 47 Script Escrita manual suportada
Inglês en Latn
Versões do processador
ID da versão Libertar Canal Descrição
pretrained-foundation-model-v1.0-2023-08-22 Estável Modelo de base da Google

Para mais informações, consulte o artigo Gerir versões do processador.

Quotas e limites
Número máximo de páginas (pedidos online/síncronos): 15
Número máximo de páginas (pedidos em lote/offline/assíncronos): 250
Número máximo de páginas (modo sem imagens online/pedidos síncronos): 30
Uptraining
Ficheiro de entrada de exemplo Abrir numa nova janela.
Exemplo de saída Abrir numa nova janela.
Regiões suportadas
  • us
Mais informações Resumidor personalizado

Notas de rodapé

[*] Este processador só está disponível para clientes com acesso limitado.

Para solicitar acesso à API, preencha e envie o formulário de solicitação do cliente de acesso limitado da IA Documental. O formulário pede informações sobre si, a sua empresa e o seu exemplo de utilização. Tenha em atenção que é necessário um ID do projeto do Google Cloud para aceder. Para criar um novo projeto do Google Cloud ou identificar o ID do projeto existente, consulte as seguintes instruções.

Depois de enviar o formulário, a equipa do Document AI vai rever a sua solicitação para garantir que cumpre os critérios de acesso. Se for aprovado, recebe um email com instruções sobre como aceder e usar esta funcionalidade.

[†] A validação de documentos de identificação funciona para extrair e avaliar informações de documentos de identificação que contribuem para identificar se a imagem de entrada representa um ID autêntico.

Na Google Cloud, damos prioridade a ajudar os clientes a desenvolver e implementar soluções de IA em segurança, e a validação de identidade foi desenvolvida de acordo com os princípios de IA da Google.

Com base nos princípios de IA da Google e no design atual dos produtos, recomendamos vivamente que tenha cuidado e avalie cuidadosamente as potenciais vantagens e riscos da utilização da validação de documentos de identidade para o seguinte:

  • Tomada de decisões sem intervenção humana para previsões que podem afetar os direitos humanos.
  • Em domínios sensíveis, incluindo, entre outros, emprego, acesso a serviços públicos, cuidados de saúde e contextos críticos para a segurança.

[‡] Use sempre a validação de identidade como parte do seu processo e fluxo de trabalho de deteção de identidade mais abrangentes. É importante ter um revisor humano no seu fluxo de trabalho para verificar se os sinais previstos são precisos. O processador de validação de identidade não se destina a substituir a revisão humana de IDs num fluxo de trabalho, mas sim a ajudar os revisores humanos na validação de documentos de identificação. O processador de validação de identidade não deve ser usado como uma ferramenta de decisão automática para determinar se um ID é válido. Com a revisão humana, os clientes podem alcançar uma maior precisão no processamento de documentos e ajudar as empresas a avaliar as previsões através de ferramentas criadas especificamente para permitir essas revisões.

Certifique-se de que revê os regulamentos na região onde está a implementar esta tecnologia e investiga as orientações existentes da indústria para saber mais acerca das diretrizes de políticas e dos problemas de equidade comuns. Leia acerca da equidade na aprendizagem automática, incluindo formas de mitigar a parcialidade em conjuntos de dados de preparação, avaliar os seus modelos personalizados quanto a disparidades no desempenho e outras considerações à medida que usa o seu modelo personalizado.

Incentivamos os clientes a terem em atenção a equidade, a interpretabilidade e as práticas recomendadas de privacidade e segurança ao implementar a validação de identidade. Para saber como implementar a IA responsável, leia as recomendações da Google para práticas de IA responsável.

Consulte a publicação no blogue Automatize o processamento de documentos de identidade com a Document AI] para ver mais informações sobre exemplos de utilização e um repositório de código de aplicação de exemplo.