Daftar prosesor

Halaman ini berisi informasi mendetail tentang semua pemroses yang ditawarkan oleh Document AI. Anda dapat melihat daftar semua pemroses berdasarkan jenis solusi.

Semua pemroses Document AI mematuhi Persyaratan Pemrosesan dan Keamanan Data.

Lihat dokumentasi Mengelola versi prosesor untuk mengetahui detail selengkapnya. Selain itu, batas pemroses tertentu berlaku selain kuota dan batas produk secara keseluruhan.

Mendigitalkan teks

Enterprise Document OCR (Pengenalan Karakter Optik)

Deskripsi

Mengidentifikasi dan mengekstrak teks dalam berbagai jenis dokumen.

Pemroses ini memungkinkan Anda mengidentifikasi dan mengekstrak teks, termasuk teks tulis tangan, dari dokumen dalam lebih dari 200 bahasa. Pemroses juga menggunakan machine learning untuk melakukan penilaian kualitas dokumen berdasarkan keterbacaan kontennya.

Kategori Mendigitalkan
Fungsi OCR, Analisis Kualitas
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API OCR_PROCESSOR
Bahasa yang didukung
Daftar lengkap bahasa
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Afrika af Latn
Albania sq Latn
Arab ar Arab
Armenia hy Armn
Belarusia be Cyrl
Bangla bn Beng
Bengali bn Beng
Bulgaria bg Cyrl
Catalan ca Latn
China zh Hani
Kroasia hr Latn
Ceko cs Latn
Denmark da Latn
Belanda nl Latn
Inggris en Latn
Estonia et Latn
Filipina fil Latn
Finlandia fi Latn
Prancis fr Latn
Jerman de Latn
Yunani el Grek
Gujarati gu Gujr
Ibrani iw Hebr
Hindi hi Deva
Hungaria hu Latn
Islan is Latn
Indonesia id Latn
Italia it Latn
Jepang ja Jpan
Kannada kn Knda
Khmer km Khmr
Korea ko Kore
Laos lo Laoo
Latvia lv Latn
Lituania lt Latn
Makedonia mk Cyrl
Melayu ms Latn
Malayalam ml Mlym
Marathi mr Deva
Nepal ne Deva
Norwegia no Latn
Persia fa Arab
Polandia pl Latn
Portugis (Portugal & Brasil) pt Latn
Punjabi pa Guru
Rumania ro Latn
Rusia ru Cyrl
Serbia sr Cyrl
Slovakia sk Latn
Slovenia sl Latn
Spanyol es Latn
Swedia sv Latn
Tagalog tl Latn
Tamil ta Taml
Telugu te Telu
Thai th Thai
Turki tr Latn
Ukraina uk Cyrl
Vietnam vi Latn
Yiddish yi Hebr
Versi prosesor
ID versi Saluran Rilis Kolom tambahan terdeteksi Bahasa tambahan yang didukung Deskripsi
pretrained-ocr-v1.0-2020-09-23 Stabil

Tidak ada

Tidak ada

Tidak direkomendasikan untuk digunakan dan akan dihentikan di Amerika Serikat (AS) dan Uni Eropa (EU) mulai 30 April 2025.
pretrained-ocr-v1.1-2022-09-12 Stabil

Tidak ada

Tidak ada

Tidak direkomendasikan untuk digunakan dan akan dihentikan di Amerika Serikat (AS) dan Uni Eropa (EU) mulai 30 April 2025.
pretrained-ocr-v1.2-2022-11-10 Stabil

Tidak ada

Tidak ada

Versi model beku v1.0: File model, konfigurasi, dan biner snapshot versi yang dibekukan dalam image container hingga 18 bulan.
pretrained-ocr-v2.0-2023-06-02 Stabil

Tidak ada

Tidak ada

Model siap produksi yang dikhususkan untuk kasus penggunaan dokumen. Mencakup akses ke semua add-on OCR.
pretrained-ocr-v2.1-2024-08-07 Kandidat rilis

Tidak ada

Tidak ada

Area utama peningkatan untuk v2.1 adalah: pengenalan teks cetak yang lebih baik, deteksi kotak centang yang lebih presisi, dan urutan pembacaan yang lebih akurat.

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 15
Halaman maksimum (permintaan batch/offline/asinkron): 500
Uptraining
Human-in-the-Loop
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Informasi selengkapnya Enterprise Document OCR

Mengekstrak entity dari dokumen

Lihat Set data sampel untuk contoh set data berlabel dan tidak berlabel yang akan digunakan untuk pelatihan.

Pengekstrak Kustom

Deskripsi

Ekstrak kolom dari dokumen menggunakan AI generatif atau model kustom; sesuaikan model untuk mengekstrak data dari dokumen Anda secara akurat.

Kategori Ekstrak
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API CUSTOM_EXTRACTION_PROCESSOR
Catatan
  • Jika menggunakan AI generatif untuk ekstraksi, maka:

    • Hanya bahasa Inggris yang didukung secara resmi.
    • Ketersediaan wilayah ada di US, EU, northamerica-northeast1, dan asia-southeast1.

Bahasa yang didukung
Daftar lengkap bahasa
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Afrika af Latn
Arab ar Arab
Azerbaijani az Latn
Azerbaijan (Sirilik) az-Cyrl Cyrl
Belarusia be Cyrl
Bulgaria bg Cyrl
Bosnia bs Latn
Catalan ca Latn
Cebu ceb Latn
Ceko cs Latn
Wales cy Latn
Denmark da Latn
Jerman de Latn
Yunani el Grek
Inggris en Latn
Esperanto eo Latn
Spanyol es Latn
Estonia et Latn
Basque eu Latn
Persia fa Arab
Finlandia fi Latn
Filipina fil Latn
Prancis fr Latn
Irlandia ga Latn
Galisia gl Latn
Hindi hi Deva
Kroasia hr Latn
Kreol Haiti ht Latn
Hungaria hu Latn
Indonesia id Latn
Islan is Latn
Italia it Latn
Ibrani iw Hebr
Jepang ja Jpan
Jawa jv Latn
Kazakh kk Cyrl
Korean ko Kore
Kyrgyz ky Cyrl
Latin la Latn
Lituania lt Latn
Latvia lv Latn
Makedonia mk Cyrl
Mongolia mn Cyrl
Marathi mr Deva
Melayu ms Latn
Malta mt Latn
Nepal ne Deva
Belanda nl Latn
Norwegia no Latn
Polandia pl Latn
Pashto ps Arab
Portugis (Portugal & Brasil) pt Latn
Rumania ro Latn
Rusia ru Cyrl
Rusia (Ortografi Petrine) ru-PETR1708 Cyrl
Sanskrit sa Deva
Slovakia sk Latn
Slovenia sl Latn
Albania sq Latn
Serbia sr Cyrl
Swedia sv Latn
Swahili sw Latn
Tagalog tl Latn
Turki tr Latn
Ukraina uk Cyrl
Urdu ur Arab
Uzbekistan uz Latn
Uzbekistan (Sirilik) uz-Cyrl Cyrl
Vietnam vi Latn
Yiddish yi Hebr
China aksara sederhana zh-Hans Hani
China (Aksara Tradisional) zh-Hant Hani
Zulu zu Latn
Versi prosesor
ID versi Saluran Rilis Kolom tambahan terdeteksi Bahasa tambahan yang didukung Deskripsi
pretrained-foundation-model-v1.0-2023-08-22 Stabil

Tidak ada

Tidak ada

Calon siap produksi yang dikhususkan untuk kasus penggunaan dokumen yang didukung oleh model visi khusus dan model dasar.
pretrained-foundation-model-v1.1-2024-03-12 Kandidat Rilis

Tidak ada

Tidak ada

Calon rilis yang didukung oleh LLM Gemini 1.0 Pro dan teknologi yang baru dikembangkan, termasuk model bahasa dan visi khusus. Juga mencakup fitur OCR lanjutan seperti deteksi kotak centang.
pretrained-foundation-model-v1.2-2024-05-10 Stabil

Tidak ada

Tidak ada

Calon yang siap diproduksi dan didukung oleh LLM Gemini 1.5 Pro dan teknologi yang baru dikembangkan, termasuk model bahasa dan visi khusus. Juga mencakup fitur OCR lanjutan seperti deteksi kotak centang. Direkomendasikan untuk pengguna yang ingin menggunakan batas token terbesar yang didukung atau bereksperimen dengan model yang lebih baru.
pretrained-foundation-model-v1.3-2024-08-31 Stabil

Tidak ada

Tidak ada

Calon yang siap produksi dan didukung oleh LLM Gemini 1.5 Flash. Juga mencakup fitur OCR lanjutan seperti deteksi kotak centang. Direkomendasikan bagi pengguna yang menginginkan latensi terendah.

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 15
Halaman maksimum (permintaan batch/offline/asinkron): 200
Jenis data yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Penambahan nilai & normalisasi, dan Membuat set data.

Daftar lengkap jenis data yang dinormalisasi
  • dateTime as STRING
  • currency as STRING
  • money as google.type.Money
  • number as FLOAT or INTEGER
Uptraining
Human-in-the-Loop
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Informasi selengkapnya Pengekstrak Kustom

Form Parser

Deskripsi

Mengekstrak pasangan nilai kunci umum (entity dan kotak centang), tabel, dan entity umum dari dokumen selain teks OCR.

Pemroses ini menerapkan teknologi machine learning lanjutan untuk mengekstrak pasangan nilai kunci, kotak centang, dan tabel dari dokumen dalam lebih dari 200 bahasa. Pemroses ini juga memanfaatkan model deep learning untuk mengekstrak 11 entitas generik yang umum di berbagai jenis dokumen.

Kategori Ekstrak
Fungsi OCR, Pemrosesan Formulir, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API FORM_PARSER_PROCESSOR
Bahasa yang didukung
Daftar lengkap bahasa
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Afrika af Latn
Albania sq Latn
Arab ar Arab
Belarusia be Cyrl
Catalan ca Latn
China zh Hani
Kroasia hr Latn
Ceko cs Latn
Denmark da Latn
Belanda nl Latn
Inggris en Latn
Estonia et Latn
Filipina fil Latn
Finlandia fi Latn
Prancis fr Latn
Jerman de Latn
Ibrani iw Hebr
Hindi hi Deva
Hungaria hu Latn
Islan is Latn
Indonesia id Latn
Italia it Latn
Jepang ja Jpan
Korean ko Kore
Latvia lv Latn
Lituania lt Latn
Makedonia mk Cyrl
Melayu ms Latn
Marathi mr Deva
Nepal ne Deva
Norwegia no Latn
Persia fa Arab
Polandia pl Latn
Portugis (Portugal & Brasil) pt Latn
Rumania ro Latn
Rusia ru Cyrl
Serbia sr Cyrl
Slovakia sk Latn
Slovenia sl Latn
Spanyol es Latn
Swedia sv Latn
Tagalog tl Latn
Turki tr Latn
Ukraina uk Cyrl
Vietnam vi Latn
Yiddish yi Hebr
Versi prosesor
ID versi Saluran Rilis Kolom tambahan terdeteksi Bahasa tambahan yang didukung Deskripsi
pretrained-form-parser-v1.0-2020-09-23 Stabil

Tidak ada

Tidak ada

Versi lama. Untuk kualitas terbaik dan rangkaian fitur lengkap, gunakan Form Parser v2.0.
pretrained-form-parser-v2.0-2022-11-10 Stabil
Menampilkan kolom
  • email
  • phone
  • url
  • date_time
  • address
  • person
  • organization
  • quantity
  • price
  • id
  • page_number

Tidak ada

Versi yang direkomendasikan. Mendukung entitas generik dan menyertakan model tabel, KVP, dan kotak centang yang diupgrade, serta lebih dari 200 bahasa.
pretrained-form-parser-v2.1-2023-06-26 Kandidat Rilis

Tidak ada

Tidak ada

Versi Pratinjau Publik. Model yang sama dengan v2.0 dengan ekstraksi teks native dari file PDF digital yang diaktifkan.

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 15
Halaman maksimum (permintaan batch/offline/asinkron): 100
Uptraining
Human-in-the-Loop
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Informasi selengkapnya Parser Formulir

Parser Tata Letak

Deskripsi

Mengekstrak elemen konten dokumen (teks, tabel, dan daftar) serta membuat potongan kontekstual.

Layout Parser mengekstrak elemen konten dokumen seperti teks, tabel, dan daftar, serta membuat potongan kontekstual yang memfasilitasi pengambilan informasi dalam AI generatif dan aplikasi penemuan.

Kategori Ekstrak
Fungsi Mengurai Tata Letak, Pemotongan Dokumen
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API LAYOUT_PARSER_PROCESSOR
Catatan
  • Parser ini mendukung file PDF, HTML, dan DOCX.
Bahasa yang didukung
Daftar lengkap bahasa
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Afrika af Latn
Albania sq Latn
Arab ar Arab
Armenia hy Armn
Belarusia be Cyrl
Bangla bn Beng
Bengali bn Beng
Bulgaria bg Cyrl
Catalan ca Latn
China zh Hani
Kroasia hr Latn
Ceko cs Latn
Denmark da Latn
Belanda nl Latn
Inggris en Latn
Estonia et Latn
Filipina fil Latn
Finlandia fi Latn
Prancis fr Latn
Jerman de Latn
Yunani el Grek
Gujarati gu Gujr
Ibrani iw Hebr
Hindi hi Deva
Hungaria hu Latn
Islan is Latn
Indonesia id Latn
Italia it Latn
Jepang ja Jpan
Kannada kn Knda
Khmer km Khmr
Korea ko Kore
Laos lo Laoo
Latvia lv Latn
Lituania lt Latn
Makedonia mk Cyrl
Melayu ms Latn
Malayalam ml Mlym
Marathi mr Deva
Nepal ne Deva
Norwegia no Latn
Persia fa Arab
Polandia pl Latn
Portugis (Portugal & Brasil) pt Latn
Punjabi pa Guru
Rumania ro Latn
Rusia ru Cyrl
Serbia sr Cyrl
Slovakia sk Latn
Slovenia sl Latn
Spanyol es Latn
Swedia sv Latn
Tagalog tl Latn
Tamil ta Taml
Telugu te Telu
Thai th Thai
Turki tr Latn
Ukraina uk Cyrl
Vietnam vi Latn
Yiddish yi Hebr
Versi prosesor
ID versi Saluran Rilis Kolom tambahan terdeteksi Bahasa tambahan yang didukung Deskripsi
pretrained-layout-parser-v1.0-2024-06-03 Stabil

Tidak ada

Tidak ada

Versi yang direkomendasikan.

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 15
Halaman maksimum (permintaan batch/offline/asinkron): 500
Uptraining
Human-in-the-Loop
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • eu
  • us
Informasi selengkapnya Parser Tata Letak

Mempelajari pemroses terlatih

Parser Laporan Mutasi Bank

Deskripsi

Mengekstrak dari laporan mutasi bank termasuk nama, rekening, transaksi, dll.

Kategori Model terlatih
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API BANK_STATEMENT_PROCESSOR
Catatan
  • Jika halaman file input multi-halaman adalah jenis dokumen yang benar dan salah satu versi yang didukung, prosesor akan melakukan ekstraksi entitas pada dokumen pertama yang didukung. Jika tidak menemukan dokumen yang berlaku dalam file input, pemroses akan menampilkan pesan error.
Bahasa yang didukung
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Inggris en Latn
Versi prosesor
ID versi Saluran Rilis Kolom tambahan terdeteksi Bahasa tambahan yang didukung Deskripsi
pretrained-bankstatement-v1.0-2021-08-08 Stabil

Tidak ada

Tidak ada

pretrained-bankstatement-v1.1-2021-08-13 Stabil

Tidak ada

Tidak ada

pretrained-bankstatement-v2.0-2021-12-10 Stabil

Tidak ada

Tidak ada

pretrained-bankstatement-v3.0-2022-05-16 Stabil

Tidak ada

Tidak ada

Versi ini mengasumsikan bahwa file input berisi satu laporan mutasi bank. Tidak seperti versi default, versi ini tidak memeriksa file input untuk laporan mutasi bank dan tidak akan menampilkan error jika tidak ada laporan mutasi bank yang ditemukan.
pretrained-bankstatement-v4.0-2023-07-31 Kandidat Rilis

Tidak ada

Tidak ada

pretrained-bankstatement-v5.0-2023-12-06 Kandidat Rilis

Tidak ada

Tidak ada

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 15
Halaman maksimum (permintaan batch/offline/asinkron): 30
Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom
  • account_number
  • account_type
  • bank_address
  • bank_name
  • client_address
  • client_name
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item
    • table_item/transaction_deposit
    • table_item/transaction_deposit_date
    • table_item/transaction_deposit_description
    • table_item/transaction_withdrawal
    • table_item/transaction_withdrawal_date
    • table_item/transaction_withdrawal_description
Kolom yang diperkaya

Anda dapat menemukan informasi selengkapnya di halaman Penambahan nilai & normalisasi.

Daftar lengkap kolom yang diperkaya
  • bank_address
  • bank_name
Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Penambahan nilai & normalisasi.

Daftar lengkap kolom yang dinormalisasi
  • ending_balance
  • starting_balance
  • statement_date
  • statement_end_date
  • statement_start_date
  • table_item/transaction_deposit
  • table_item/transaction_deposit_date
  • table_item/transaction_withdrawal
  • table_item/transaction_withdrawal_date
Uptraining
Human-in-the-Loop
Petunjuk Pelabelan Buka di jendela baru.
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • eu
  • us

Parser W2

Deskripsi

Mengekstrak dari Formulir W2, termasuk karyawan, pemberi kerja, gaji, dll.

Kategori Model terlatih
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API FORM_W2_PROCESSOR
Catatan
  • Jika halaman file input multi-halaman adalah jenis dokumen yang benar dan salah satu versi yang didukung, prosesor akan melakukan ekstraksi entitas pada dokumen pertama yang didukung. Jika tidak menemukan dokumen yang berlaku dalam file input, pemroses akan menampilkan pesan error.
Bahasa yang didukung
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Inggris en Latn
Bentuk/versi yang didukung
  • 2020 (versi standar dan yang disesuaikan)
  • 2019 (versi standar dan kustom)
  • 2018 (versi standar dan yang disesuaikan)
Versi prosesor
ID versi Saluran Rilis Kolom tambahan terdeteksi Bahasa tambahan yang didukung Deskripsi
pretrained-w2-v1.0-2020-10-01 Stabil

Tidak ada

Tidak ada

pretrained-w2-v1.1-2022-01-27 Stabil

Tidak ada

Tidak ada

pretrained-w2-v1.2-2022-01-28 Stabil
Menampilkan kolom
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalityName_Line1
  • LocalWagesTipsEtc_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • SSN
  • State_Line1
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • WagesTipsOtherCompensation

Tidak ada

Peningkatan kualitas dan mendukung kolom baru; tidak termasuk pemisah.

pretrained-w2-v2.0-2022-03-30 Kandidat Rilis
Menampilkan kolom
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

Tidak ada

Peningkatan kualitas dan dukungan untuk kolom kotak 12 serta prediksi terperinci EmployeeName, EmployeeAddress, dan EmployerNameAndAddress, yang semuanya tidak lagi menjadi bagian dari output dan diganti dengan kolom tambahan.

pretrained-w2-v2.1-2022-06-08 Stabil
Menampilkan kolom
  • AllocatedTips
  • ControlNumber
  • DependentCareBenefits
  • EIN
  • EmployeeAddress_AdditionalStreetAddressOrPostalBox
  • EmployeeAddress_City
  • EmployeeAddress_State
  • EmployeeAddress_StreetAddressOrPostalBox
  • EmployeeAddress_Zip
  • EmployeeName_FirstName
  • EmployeeName_LastName
  • EmployeeName_MiddleNameOrInitial
  • EmployeeName_Suffix
  • EmployerAddress_AdditionalStreetAddressOrPostalBox
  • EmployerAddress_City
  • EmployerAddress_State
  • EmployerAddress_StreetAddressOrPostalBox
  • EmployerAddress_Zip
  • EmployerName
  • EmployerStateIdNumber_Line1
  • FederalIncomeTaxWithheld
  • FormYear
  • LocalIncomeTax_Line1
  • LocalWagesTipsEtc_Line1
  • LocalityName_Line1
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • NonqualifiedPlans
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityTips
  • SocialSecurityWages
  • StateIncomeTax_Line1
  • StateWagesTipsEtc_Line1
  • State_Line1
  • WagesTipsOtherCompensation
  • a_Code
  • a_Value
  • b_Code
  • b_Value
  • c_Code
  • c_Value
  • d_Code
  • d_Value

Tidak ada

Mirip dengan versi pretrained-w2-v2.0-2022-03-30 dengan peningkatan kualitas lebih lanjut dan memperkenalkan satu entitas lagi EmployeeName_Suffix.

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 15
Halaman maksimum (permintaan batch/offline/asinkron): 15
Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom
  • ControlNumber
  • EIN
  • EmployeeAddress
  • EmployeeName
  • EmployerNameAndAddress
  • FederalIncomeTaxWithheld
  • MedicareTaxWithheld
  • MedicareWagesAndTips
  • SSN
  • SocialSecurityTaxWithheld
  • SocialSecurityWages
  • WagesTipsOtherCompensation
Kolom yang diperkaya

Anda dapat menemukan informasi selengkapnya di halaman Penambahan nilai & normalisasi.

Daftar lengkap kolom yang diperkaya
  • EmployerNameAndAddress
  • EIN
Uptraining
Human-in-the-Loop
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • eu
  • us

Parser Paspor Amerika Serikat

Deskripsi

Ekstrak kolom seperti nama, ID dokumen, tanggal lahir, dll.

Kategori Model terlatih
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API US_PASSPORT_PROCESSOR
Bahasa yang didukung
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Inggris en Latn
Versi prosesor
ID versi Saluran Rilis Kolom tambahan terdeteksi Bahasa tambahan yang didukung Deskripsi
pretrained-us-passport-v1.0-2021-06-14 Stabil

Tidak ada

Tidak ada

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 2
Halaman maksimum (permintaan batch/offline/asinkron): 2
Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • MRZ Code
  • Portrait
Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Penambahan nilai & normalisasi.

Daftar lengkap kolom yang dinormalisasi
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
Human-in-the-Loop
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • eu
  • us

Parser Utilitas

Deskripsi

Mengekstrak teks dan nilai dari tagihan utilitas seperti nama pemasok dan jumlah yang dibayarkan sebelumnya.

Kategori Model terlatih
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Terbatas [*]
Ketik API UTILITY_PROCESSOR
Bahasa yang didukung
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Inggris en Latn
Versi prosesor
ID versi Saluran Rilis Kolom tambahan terdeteksi Bahasa tambahan yang didukung Deskripsi
pretrained-utility-v1.1-2021-04-09 Stabil

Tidak ada

Tidak ada

pretrained-utility-v1.2-2022-12-15 Kandidat Rilis

Tidak ada

Tidak ada

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 10
Halaman maksimum (permintaan batch/offline/asinkron): 200
Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • deposit_credited_amount
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • late_fee_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/frequency
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/service_address
    • line_item/service_end_date
    • line_item/service_id_1
    • line_item/service_id_2
    • line_item/service_start_date
    • line_item/supplier_account_number
    • line_item/tax_amount
    • line_item/unit_number
    • line_item/unit_of_measure
    • line_item/unit_price
    • line_item/usage
  • net_amount
  • payment_terms
  • prior_amount_due
  • prior_paid_amount
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • reclaimed_water
  • remit_to_address
  • remit_to_name
  • service
    • service/service_end_date
    • service/service_id
    • service/service_start_date
    • service/unit_of_measure
    • service/usage
  • service_address
  • service_end_date
  • service_id
  • service_start_date
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_account_number
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • tampering
  • total_amount
  • total_tax_amount
  • usage
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Penambahan nilai & normalisasi.

Daftar lengkap kolom yang dinormalisasi
  • adjusted_amount
  • amount_due
  • balance_transfer_amount
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • invoice_date
  • late_fee_amount
  • line_item/amount
  • line_item/quantity
  • line_item/tax_amount
  • line_item/unit_price
  • net_amount
  • prior_amount_due
  • prior_paid_amount
  • total_amount
  • total_tax_amount
Uptraining
Human-in-the-Loop
Petunjuk Pelabelan Buka di jendela baru.
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • eu
  • us

Parser Pemeriksaan Dokumen Identitas

Deskripsi

Memprediksi validitas dokumen identitas menggunakan beberapa sinyal.

Pemroses Pemeriksaan Dokumen Identitas dirancang untuk membantu memprediksi validitas dokumen identitas dengan empat sinyal yang berbeda.

Saat ini, prosesor menampilkan informasi dari sinyal berikut:

  • Deteksi fraud_signals_is_identity_document: Memprediksi apakah gambar berisi dokumen identitas yang dikenali.
  • Deteksi fraud_signals_suspicious_words: Memprediksi apakah ada kata yang tidak biasa pada ID.
  • Deteksi fraud_signals_image_manipulation: Memprediksi apakah gambar diubah atau dirusak dengan alat pengeditan gambar.
  • fraud_signals_online_duplicate detection: Memprediksi apakah gambar dapat ditemukan secara online (khusus Amerika Serikat).

Kategori Model terlatih
Fungsi OCR, Analisis Kualitas
Tahap rilis Pratinjau
Status akses Publik
Ketik API ID_PROOFING_PROCESSOR
Catatan
  • Fitur Deteksi Duplikat Online saat ini diproses di pusat data AS. Dukungan regional dan multi-regional tidak tersedia untuk fitur ini di luar Amerika Serikat.
  • Prosesor ini didukung oleh algoritma yang lebih sering diperbarui daripada versi prosesor baru yang dirilis. Karena alasan ini, prosesor mungkin menampilkan output yang berbeda dari waktu ke waktu meskipun menggunakan versi prosesor yang sama. Misalnya, sistem Deteksi Duplikat Online memantau gambar yang ada di web. Perilaku sistem kemudian dapat berubah lebih cepat daripada yang dapat dilacak dalam versi prosesor.
  • Lihat catatan tentang Responsible AI[†] dan Peninjauan manual.[‡]
Bahasa yang didukung
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Inggris en Latn
Bentuk/versi yang didukung
  • Dukungan untuk paspor, kartu izin, dan surat izin mengemudi Amerika Serikat.
Versi prosesor
ID versi Saluran Rilis Kolom tambahan terdeteksi Bahasa tambahan yang didukung Deskripsi
pretrained-id-proofing-v1.0-2022-10-03 Stabil

Tidak ada

Tidak ada

pretrained-id-proofing-v1.1-2023-05-18 Kandidat Rilis
Menampilkan kolom
  • fraud_signals_photocopy_detection

Tidak ada

Sinyal deteksi fotokopi tambahan

pretrained-id-proofing-v1.2-2023-10-04 Kandidat Rilis
Menampilkan kolom
  • fraud_signals_photocopy_detection

Tidak ada

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 2
Halaman maksimum (permintaan batch/offline/asinkron): 2
Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
  • evidence_suspicious_word
  • evidence_inconclusive_suspicious_word
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_photocopy_detection
  • evidence_hostname (US only)
  • evidence_thumbnail_url (US only)
Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Penambahan nilai & normalisasi.

Daftar lengkap kolom yang dinormalisasi
  • fraud_signals_image_manipulation
  • fraud_signals_online_duplicate (US only)
  • fraud_signals_is_identity_document
  • fraud_signals_suspicious_words
Uptraining
Human-in-the-Loop
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • eu
  • us

Parser Slip Gaji

Deskripsi

Mengekstrak dari slip gaji, termasuk nama, bisnis, jumlah, dll.

Kategori Model terlatih
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API PAYSTUB_PROCESSOR
Catatan
  • Jika dokumen input multi-halaman berisi lebih dari satu slip gaji yang valid, pemroses hanya akan mengekstrak entitas dari slip gaji pertama yang valid. Jika tidak ada slip gaji yang ditemukan dalam file input, pemroses akan menampilkan pesan error.
Bahasa yang didukung
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Inggris en Latn
Versi prosesor
ID versi Saluran Rilis Kolom tambahan terdeteksi Bahasa tambahan yang didukung Deskripsi
pretrained-paystub-v1.0-2021-03-19 Stabil

Tidak ada

Tidak ada

pretrained-paystub-v1.1-2021-08-13 Stabil
Menampilkan kolom
  • net_pay
  • net_pay_ytd
  • employee_account_number

Tidak ada

Peningkatan kualitas dan dukungan kolom baru;
pretrained-paystub-v1.2-2021-12-10 Stabil

Tidak ada

Tidak ada

pretrained-paystub-v2.0-2022-05-17 Kandidat Rilis
Menampilkan kolom
  • deduction_item
  • deduction_item/deduction_type
  • deduction_item/deduction_this_period
  • deduction_item/deduction_ytd
  • direct_deposit_item
  • direct_deposit_item/direct_deposit
  • direct_deposit_item/employee_account_number
  • earning_item
  • earning_item/earning_type
  • earning_item/earning_rate
  • earning_item/earning_hours
  • earning_item/earning_this_period
  • earning_item/earning_ytd
  • page_number
  • tax_item
  • tax_item/tax_type
  • tax_item/tax_this_period
  • tax_item/tax_ytd
  • federal_additional_tax
  • federal_allowance
  • federal_marital_status
  • state_additional_tax
  • state_allowance
  • state_marital_status

Tidak ada

Versi ini mengasumsikan bahwa file input berisi satu slip gaji. Tidak seperti versi default, versi ini tidak memeriksa file input untuk slip gaji dan tidak akan menampilkan error jika tidak ada slip gaji yang ditemukan.

Peningkatan kualitas, dukungan kolom baru, dan skema baru. Bonus, Komisi, Hari Libur, Lembur, Gaji Reguler, dan Liburan kini menjadi bagian dari earning_item/earning_this_period, dan versi tahun berjalannya ada di earning_item/earning_ytd. Setoran Langsung dan Nomor Akun Karyawan kini disusun bertingkat di bagian direct_deposit_item.

Batas halaman asinkron adalah 10.

pretrained-paystub-v2.0-2022-07-22 Stabil

Tidak ada

Tidak ada

Peningkatan kualitas dan peningkatan pelatihan.

pretrained-paystub-v3.0-2023-12-06 Kandidat Rilis

Tidak ada

Tidak ada

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 15
Halaman maksimum (permintaan batch/offline/asinkron): 50
Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • employee_account_number (Added in "pretrained-paystub-v1.1-2021-08-13")
  • employee_address
  • employee_name
  • employer_address
  • employer_name
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay (Added in "pretrained-paystub-v1.1-2021-08-13")
  • net_pay_ytd (Added in "pretrained-paystub-v1.1-2021-08-13")
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • ssn
  • start_date
  • vacation
  • vacation_ytd
Kolom yang diperkaya

Anda dapat menemukan informasi selengkapnya di halaman Penambahan nilai & normalisasi.

Daftar lengkap kolom yang diperkaya
  • employer_address
  • employer_name
Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Penambahan nilai & normalisasi.

Daftar lengkap kolom yang dinormalisasi
  • bonus
  • bonus_ytd
  • commissions
  • commissions_ytd
  • direct_deposit
  • end_date
  • gross_earnings
  • gross_earnings_ytd
  • holiday
  • holiday_ytd
  • net_pay
  • net_pay_ytd
  • overtime
  • overtime_ytd
  • pay_date
  • regular_pay
  • regular_pay_ytd
  • start_date
  • vacation
  • vacation_ytd
Uptraining
Human-in-the-Loop
Petunjuk Pelabelan Buka di jendela baru.
Wilayah yang didukung
  • eu
  • us

Parser surat izin mengemudi (SIM) Amerika Serikat

Deskripsi

Ekstrak kolom seperti nama, ID dokumen, tanggal lahir, dll.

Kategori Model terlatih
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API US_DRIVER_LICENSE_PROCESSOR
Bahasa yang didukung
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Inggris en Latn
Bentuk/versi yang didukung
  • Mendukung seluruh 50 Negara Bagian dan D.C.
Versi prosesor
ID versi Saluran Rilis Kolom tambahan terdeteksi Bahasa tambahan yang didukung Deskripsi
pretrained-us-driver-license-v1.0-2021-06-14 Stabil

Tidak ada

Tidak ada

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 2
Halaman maksimum (permintaan batch/offline/asinkron): 2
Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom
  • Family Name
  • Given Names
  • Document Id
  • Expiration Date
  • Date Of Birth
  • Issue Date
  • Address
  • Portrait
Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Penambahan nilai & normalisasi.

Daftar lengkap kolom yang dinormalisasi
  • Date Of Birth
  • Expiration Date
  • Issue Date
Uptraining
Human-in-the-Loop
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • eu
  • us

Parser Pengeluaran

Deskripsi

Mengekstrak teks dan nilai dari dokumen pengeluaran seperti tanggal pengeluaran, nama pemasok, jumlah total, dan mata uang.

Kategori Model terlatih
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API EXPENSE_PROCESSOR
Bahasa yang didukung
Daftar lengkap bahasa
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Jerman de Latn
Inggris en Latn
Spanyol es Latn
Prancis fr Latn
Jepang ja Jpan
Belanda nl Latn
Versi prosesor
ID versi Saluran Rilis Kolom tambahan terdeteksi Bahasa tambahan yang didukung Deskripsi
pretrained-expense-v1.1-2021-04-09 Stabil

Tidak ada

Tidak ada

Diluncurkan pada April 2021. Penghentian penggunaan akan segera direncanakan.
pretrained-expense-v1.2-2022-02-18 Stabil

Tidak ada

Tidak ada

pretrained-expense-v1.3-2022-07-15 Stabil
Menampilkan kolom
  • credit_card_last_four_digits
  • line_item/quantity
  • payment_type
  • ja: Jepang
Dukungan untuk folio hotel dan rental mobil.
pretrained-expense-v1.3.2-2024-09-11 Kandidat Rilis
Menampilkan kolom
  • credit_card_last_four_digits
  • line_item/quantity
  • payment_type
  • ja: Jepang
Upgrade ke v1.3 dengan model visi yang mendasarinya yang ditingkatkan.
pretrained-expense-v1.4-2022-11-18 Kandidat Rilis
Menampilkan kolom
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: Jepang
  • it: Italia
  • pt: Portugis (Portugal & Brasil)
Peningkatan performa dan dukungan untuk pelatihan lanjutan. Batas halaman maksimum (permintaan online/sinkron) telah ditingkatkan menjadi 15.
pretrained-expense-v1.4.2-2024-09-12 Kandidat Rilis
Menampilkan kolom
  • traveler_name
  • reservation_id
  • line_item/transaction_date
  • ja: Jepang
  • it: Italia
  • pt: Portugis (Portugal & Brasil)
Upgrade ke v1.4 dengan model visi yang ditingkatkan.

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 10
Halaman maksimum (permintaan batch/offline/asinkron): 10
Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom
  • credit_card_last_four_digits
  • currency
  • end_date
  • net_amount
  • payment_type
  • purchase_time
  • receipt_date
  • start_date
  • supplier_address
  • supplier_city
  • supplier_name
  • tip_amount
  • total_amount
  • total_tax_amount
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
Kolom yang diperkaya

Anda dapat menemukan informasi selengkapnya di halaman Penambahan nilai & normalisasi.

Daftar lengkap kolom yang diperkaya
  • supplier_address
  • supplier_name
  • supplier_phone
Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Penambahan nilai & normalisasi.

Daftar lengkap kolom yang dinormalisasi
  • currency
  • total_amount
  • total_tax_amount
  • net_amount
  • receipt_date
  • purchase_time
  • start_date
  • end_date
  • line_item/amount
  • line_item/payment_date
  • line_item/payment_amount
Uptraining
Human-in-the-Loop
Petunjuk Pelabelan Buka di jendela baru.
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Parser Invoice

Deskripsi

Mengekstrak teks dan nilai dari invoice seperti nomor invoice, nama pemasok, jumlah invoice, jumlah pajak, tanggal invoice, tanggal jatuh tempo.

Parser invoice mengekstrak kolom header dan item baris, seperti nomor invoice, nama pemasok, jumlah invoice, jumlah pajak, tanggal invoice, tanggal jatuh tempo, dan jumlah item baris.

Kategori Model terlatih
Fungsi OCR, Ekstraksi Entity
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API INVOICE_PROCESSOR
Bahasa yang didukung
Daftar lengkap bahasa
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Jerman de Latn
Inggris en Latn
Spanyol es Latn
Estonia et Latn
Prancis fr Latn
Italia it Latn
Latvia lv Latn
Lituania lt Latn
Belanda nl Latn
Portugis (Portugal & Brasil) pt Latn
Rumania ro Latn
Swedia sv Latn
Versi prosesor
ID versi Saluran Rilis Kolom tambahan terdeteksi Bahasa tambahan yang didukung Deskripsi
pretrained-invoice-v1.1-2021-04-09 Stabil

Tidak ada

Tidak ada

pretrained-invoice-v1.2-2022-02-18 Stabil

Tidak ada

Tidak ada

Penghentian penggunaan akan segera direncanakan.
pretrained-invoice-v1.3-2022-07-15 Stabil

Tidak ada

  • it: Italia
  • pt: Portugis (Portugal & Brasil)
  • ro: Rumania
  • sv: Swedia
  • et: Estonia
  • lv: Latvia
  • lt: Lituania
Versi pemroses yang dapat dilatih ulang. Halaman maksimum (permintaan online/sinkron) telah ditingkatkan menjadi 15.
pretrained-invoice-v1.4-2022-10-21 Kandidat Rilis

Tidak ada

Tidak ada

Versi pemroses yang dapat dilatih ulang. Halaman maksimum (permintaan online/sinkron) telah ditingkatkan menjadi 15.
pretrained-invoice-v1.5-2023-09-15 Kandidat Rilis

Tidak ada

Tidak ada

pretrained-invoice-v2.0-2023-12-06 Kandidat Rilis

Tidak ada

Tidak ada

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 15
Halaman maksimum (permintaan batch/offline/asinkron): 200
Kolom yang terdeteksi di versi paling awal

Anda juga dapat menemukan informasi ini di halaman Kolom terdeteksi.

Daftar lengkap kolom
  • amount_paid_since_last_invoice
  • carrier
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • invoice_id
  • line_item
    • line_item/amount
    • line_item/description
    • line_item/product_code
    • line_item/purchase_order
    • line_item/quantity
    • line_item/unit
    • line_item/unit_price
  • net_amount
  • payment_terms
  • purchase_order
  • receiver_address
  • receiver_email
  • receiver_name
  • receiver_phone
  • receiver_tax_id
  • receiver_website
  • remit_to_address
  • remit_to_name
  • ship_from_address
  • ship_from_name
  • ship_to_address
  • ship_to_name
  • supplier_address
  • supplier_email
  • supplier_iban
  • supplier_name
  • supplier_payment_ref
  • supplier_phone
  • supplier_registration
  • supplier_tax_id
  • supplier_website
  • total_amount
  • total_tax_amount
  • vat
    • vat/amount
    • vat/category_code
    • vat/tax_amount
    • vat/tax_rate
Kolom yang diperkaya

Anda dapat menemukan informasi selengkapnya di halaman Penambahan nilai & normalisasi.

Daftar lengkap kolom yang diperkaya
  • supplier_address
  • supplier_name
  • supplier_phone
Kolom yang dinormalisasi

Anda dapat menemukan informasi selengkapnya di halaman Penambahan nilai & normalisasi.

Daftar lengkap kolom yang dinormalisasi
  • amount_paid_since_last_invoice
  • currency
  • currency_exchange_rate
  • delivery_date
  • due_date
  • freight_amount
  • invoice_date
  • net_amount
  • total_amount
  • total_tax_amount
  • line_item/amount
  • line_item/quantity
  • line_item/unit_price
  • vat/amount
  • vat/tax_amount
  • vat/tax_rate
Uptraining
Human-in-the-Loop
Petunjuk Pelabelan Buka di jendela baru.
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • northamerica-northeast1
  • us

Mengklasifikasikan dokumen

Pengklasifikasi Kustom

Deskripsi

Latih model untuk mengklasifikasikan jenis dokumen dari serangkaian class.

Kategori Klasifikasikan
Fungsi OCR, Klasifikasi
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API CUSTOM_CLASSIFICATION_PROCESSOR
Bahasa yang didukung
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Inggris en Latn
Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 15
Halaman maksimum (permintaan batch/offline/asinkron): 200
Uptraining
Human-in-the-Loop
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Informasi selengkapnya Membuat pemroses klasifikasi kustom

Pemisah Kustom

Deskripsi

Melatih model untuk memisahkan file yang berisi beberapa dokumen menjadi dokumen individual yang diklasifikasikan.

Kategori Klasifikasikan
Fungsi OCR, Klasifikasi, Pemisahan
Tahap rilis Ketersediaan umum
Status akses Publik
Ketik API CUSTOM_SPLITTING_PROCESSOR
Catatan
  • i18n hanya dapat didukung melalui opsi pelatihan kustom.
Bahasa yang didukung
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Inggris en Latn
Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 15
Halaman maksimum (permintaan batch/offline/asinkron): 1000
Uptraining
Human-in-the-Loop
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • asia-south1
  • asia-southeast1
  • australia-southeast1
  • eu
  • europe-west2
  • europe-west3
  • northamerica-northeast1
  • us
Informasi selengkapnya Membuat pemroses pemisah kustom

Meringkas dokumen

Peringkas

Deskripsi

Dapatkan ringkasan abstrak dan poin berbutir untuk dokumen pendek dan panjang.

Kategori terlatih
Fungsi Ringkasan
Tahap rilis Pratinjau
Status akses Publik
Ketik API SUMMARY_PROCESSOR
Bahasa yang didukung
Nama Bahasa Tag BCP 47 Skrip Tulisan tangan didukung
Inggris en Latn
Versi prosesor
ID versi Saluran Rilis Kolom tambahan terdeteksi Bahasa tambahan yang didukung Deskripsi
pretrained-foundation-model-v1.0-2023-08-22 Stabil

Tidak ada

Tidak ada

Model dasar Google

Untuk mengetahui informasi selengkapnya, lihat Mengelola versi pemroses.

Kuota dan batas
Halaman maksimum (permintaan online/sinkron): 15
Halaman maksimum (permintaan batch/offline/asinkron): 250
Uptraining
Human-in-the-Loop
Contoh File Input Buka di jendela baru.
Contoh Output Buka di jendela baru.
Wilayah yang didukung
  • us
Informasi selengkapnya Penyingkat kustom

Catatan kaki

[*] Pemroses ini hanya tersedia untuk pelanggan dengan akses terbatas.

Untuk meminta akses API, isi dan kirim formulir permintaan pelanggan akses terbatas Document AI. Formulir tersebut meminta informasi tentang Anda, perusahaan Anda, dan kasus penggunaan Anda. Perhatikan bahwa Project ID Google Cloud diperlukan untuk mendapatkan akses. Untuk membuat project Google Cloud baru atau mengidentifikasi Project ID dari project Anda yang sudah ada, lihat petunjuk berikut.

Setelah Anda mengirimkan formulir, tim Document AI akan meninjau permintaan Anda untuk memastikan Anda memenuhi kriteria akses. Jika disetujui, Anda akan menerima email berisi petunjuk tentang cara mengakses dan menggunakan fitur ini.

[†] Pemeriksaan Dokumen Identitas berfungsi untuk mengekstrak dan mengevaluasi informasi dari dokumen tanda pengenal yang berkontribusi untuk mengidentifikasi apakah gambar input merepresentasikan tanda pengenal yang autentik.

Di Google Cloud, kami memprioritaskan untuk membantu pelanggan mengembangkan dan mengimplementasikan solusi AI dengan aman, dan Identity Proofing telah dikembangkan sesuai dengan Prinsip AI Google.

Berdasarkan Prinsip AI Google dan desain produk saat ini, sebaiknya gunakan kehati-hatian dan evaluasi dengan cermat potensi manfaat dan risiko penggunaan Verifikasi Dokumen Identitas untuk hal berikut:

  • Pengambilan keputusan tanpa campur tangan manusia untuk prediksi yang dapat memengaruhi hak asasi manusia.
  • Dalam domain sensitif, termasuk, tetapi tidak terbatas pada, pekerjaan, akses ke layanan publik, layanan kesehatan, dan konteks yang sangat penting bagi keselamatan.

[‡] Selalu gunakan Identity Proofing sebagai bagian dari proses dan alur kerja deteksi identitas yang lebih luas. Anda harus memiliki peninjau manual dalam alur kerja untuk memverifikasi apakah sinyal yang diprediksi akurat. Pemroses Identity Proofing tidak dimaksudkan untuk menggantikan peninjauan ID oleh manusia dalam alur kerja, tetapi untuk membantu peninjau manusia dalam memvalidasi dokumen tanda pengenal. Pemroses Identity Proofing tidak boleh digunakan sebagai alat pengambilan keputusan otomatis untuk menentukan apakah tanda pengenal valid. Dengan peninjauan manual, pelanggan dapat mencapai akurasi pemrosesan dokumen yang lebih tinggi dan membantu bisnis mengevaluasi prediksi menggunakan alat yang dibuat khusus untuk mendukung peninjauan tersebut.

Pastikan Anda meninjau peraturan di wilayah tempat Anda menerapkan teknologi ini, dan pelajari panduan industri yang ada untuk mempelajari pedoman kebijakan dan masalah keadilan yang umum. Baca tentang keadilan dalam machine learning, termasuk cara mengurangi bias dalam set data pelatihan, mengevaluasi model kustom Anda untuk mendeteksi kesenjangan performa, dan pertimbangan lainnya saat Anda menggunakan model kustom Anda.

Sebaiknya pelanggan mempertimbangkan keadilan, penafsiran, serta praktik terbaik privasi dan keamanan saat menerapkan Verifikasi Identitas. Untuk mempelajari lebih lanjut cara menerapkan responsible AI, baca rekomendasi Google untuk praktik Responsible AI.

Baca postingan blog Mengotomatiskan pemrosesan dokumen identitas dengan Document AI] untuk mengetahui informasi selengkapnya tentang kasus penggunaan dan contoh repositori kode aplikasi.