Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Daftar prosesor
Halaman ini berisi informasi mendetail tentang semua pemroses yang ditawarkan oleh
Document AI. Anda dapat melihat daftar semua pemroses berdasarkan jenis solusi.
Lihat dokumentasi Mengelola versi prosesor
untuk mengetahui detail selengkapnya. Selain itu, batas pemroses tertentu berlaku selain kuota dan batas produk secara keseluruhan.
Mendigitalkan teks
Enterprise Document OCR (Pengenalan Karakter Optik)
Deskripsi
Mengidentifikasi dan mengekstrak teks dalam berbagai jenis dokumen.
Pemroses ini memungkinkan Anda mengidentifikasi dan mengekstrak teks, termasuk teks tulis tangan, dari dokumen dalam lebih dari 200 bahasa. Pemroses juga menggunakan machine learning untuk melakukan penilaian kualitas dokumen berdasarkan keterbacaan kontennya.
Tidak direkomendasikan untuk digunakan dan akan dihentikan di Amerika Serikat (AS) dan Uni Eropa (EU) mulai 30 April 2025.
pretrained-ocr-v1.1-2022-09-12
Stabil
Tidak ada
Tidak ada
Tidak direkomendasikan untuk digunakan dan akan dihentikan di Amerika Serikat (AS) dan Uni Eropa (EU) mulai 30 April 2025.
pretrained-ocr-v1.2-2022-11-10
Stabil
Tidak ada
Tidak ada
Versi model beku v1.0: File model, konfigurasi, dan biner snapshot versi yang dibekukan dalam image container hingga 18 bulan.
pretrained-ocr-v2.0-2023-06-02
Stabil
Tidak ada
Tidak ada
Model siap produksi yang dikhususkan untuk kasus penggunaan dokumen. Mencakup akses ke semua add-on OCR.
pretrained-ocr-v2.1-2024-08-07
Kandidat rilis
Tidak ada
Tidak ada
Area utama peningkatan untuk v2.1 adalah: pengenalan teks cetak yang lebih baik, deteksi kotak centang yang lebih presisi, dan urutan pembacaan yang lebih akurat.
Jika menggunakan AI generatif untuk ekstraksi, maka:
Hanya bahasa Inggris yang didukung secara resmi.
Ketersediaan wilayah ada di US, EU, northamerica-northeast1, dan asia-southeast1.
Bahasa yang didukung
Daftar lengkap bahasa
Nama Bahasa
Tag BCP 47
Skrip
Tulisan tangan didukung
Afrika
af
Latn
Arab
ar
Arab
Azerbaijani
az
Latn
Azerbaijan (Sirilik)
az-Cyrl
Cyrl
Belarusia
be
Cyrl
Bulgaria
bg
Cyrl
Bosnia
bs
Latn
Catalan
ca
Latn
Cebu
ceb
Latn
Ceko
cs
Latn
Wales
cy
Latn
Denmark
da
Latn
Jerman
de
Latn
Yunani
el
Grek
Inggris
en
Latn
Esperanto
eo
Latn
Spanyol
es
Latn
Estonia
et
Latn
Basque
eu
Latn
Persia
fa
Arab
Finlandia
fi
Latn
Filipina
fil
Latn
Prancis
fr
Latn
Irlandia
ga
Latn
Galisia
gl
Latn
Hindi
hi
Deva
Kroasia
hr
Latn
Kreol Haiti
ht
Latn
Hungaria
hu
Latn
Indonesia
id
Latn
Islan
is
Latn
Italia
it
Latn
Ibrani
iw
Hebr
Jepang
ja
Jpan
Jawa
jv
Latn
Kazakh
kk
Cyrl
Korean
ko
Kore
Kyrgyz
ky
Cyrl
Latin
la
Latn
Lituania
lt
Latn
Latvia
lv
Latn
Makedonia
mk
Cyrl
Mongolia
mn
Cyrl
Marathi
mr
Deva
Melayu
ms
Latn
Malta
mt
Latn
Nepal
ne
Deva
Belanda
nl
Latn
Norwegia
no
Latn
Polandia
pl
Latn
Pashto
ps
Arab
Portugis (Portugal & Brasil)
pt
Latn
Rumania
ro
Latn
Rusia
ru
Cyrl
Rusia (Ortografi Petrine)
ru-PETR1708
Cyrl
Sanskrit
sa
Deva
Slovakia
sk
Latn
Slovenia
sl
Latn
Albania
sq
Latn
Serbia
sr
Cyrl
Swedia
sv
Latn
Swahili
sw
Latn
Tagalog
tl
Latn
Turki
tr
Latn
Ukraina
uk
Cyrl
Urdu
ur
Arab
Uzbekistan
uz
Latn
Uzbekistan (Sirilik)
uz-Cyrl
Cyrl
Vietnam
vi
Latn
Yiddish
yi
Hebr
China aksara sederhana
zh-Hans
Hani
China (Aksara Tradisional)
zh-Hant
Hani
Zulu
zu
Latn
Versi prosesor
ID versi
Saluran Rilis
Kolom tambahan terdeteksi
Bahasa tambahan yang didukung
Deskripsi
pretrained-foundation-model-v1.0-2023-08-22
Stabil
Tidak ada
Tidak ada
Calon siap produksi yang dikhususkan untuk kasus penggunaan dokumen yang didukung oleh model visi khusus dan model dasar.
pretrained-foundation-model-v1.1-2024-03-12
Kandidat Rilis
Tidak ada
Tidak ada
Calon rilis yang didukung oleh LLM Gemini 1.0 Pro dan teknologi yang baru dikembangkan, termasuk model bahasa dan visi khusus. Juga mencakup fitur OCR lanjutan seperti deteksi kotak centang.
pretrained-foundation-model-v1.2-2024-05-10
Stabil
Tidak ada
Tidak ada
Calon yang siap diproduksi dan didukung oleh LLM Gemini 1.5 Pro dan teknologi yang baru dikembangkan, termasuk model bahasa dan visi khusus. Juga mencakup fitur OCR lanjutan seperti deteksi kotak centang. Direkomendasikan untuk pengguna yang ingin menggunakan batas token terbesar yang didukung atau bereksperimen dengan model yang lebih baru.
pretrained-foundation-model-v1.3-2024-08-31
Stabil
Tidak ada
Tidak ada
Calon yang siap produksi dan didukung oleh LLM Gemini 1.5 Flash. Juga mencakup fitur OCR lanjutan seperti deteksi kotak centang. Direkomendasikan bagi pengguna yang menginginkan latensi terendah.
Mengekstrak pasangan nilai kunci umum (entity dan kotak centang), tabel, dan entity umum dari dokumen selain teks OCR.
Pemroses ini menerapkan teknologi machine learning lanjutan untuk mengekstrak pasangan nilai kunci, kotak centang, dan tabel dari dokumen dalam lebih dari 200 bahasa. Pemroses ini juga memanfaatkan model deep learning untuk mengekstrak 11 entitas generik yang umum di berbagai jenis dokumen.
Versi lama. Untuk kualitas terbaik dan rangkaian fitur lengkap, gunakan Form Parser v2.0.
pretrained-form-parser-v2.0-2022-11-10
Stabil
Menampilkan kolom
email
phone
url
date_time
address
person
organization
quantity
price
id
page_number
Tidak ada
Versi yang direkomendasikan. Mendukung entitas generik dan menyertakan model tabel, KVP, dan kotak centang yang diupgrade, serta lebih dari 200 bahasa.
pretrained-form-parser-v2.1-2023-06-26
Kandidat Rilis
Tidak ada
Tidak ada
Versi Pratinjau Publik. Model yang sama dengan v2.0 dengan ekstraksi teks native dari file PDF digital yang diaktifkan.
Mengekstrak elemen konten dokumen (teks, tabel, dan daftar) serta membuat potongan kontekstual.
Layout Parser mengekstrak elemen konten dokumen seperti teks, tabel, dan daftar, serta membuat potongan kontekstual yang memfasilitasi pengambilan informasi dalam AI generatif dan aplikasi penemuan.
Jika halaman file input multi-halaman adalah jenis dokumen yang benar dan salah satu versi yang didukung, prosesor akan melakukan ekstraksi entitas pada dokumen pertama yang didukung. Jika tidak menemukan dokumen yang berlaku dalam file input, pemroses akan menampilkan pesan error.
Bahasa yang didukung
Nama Bahasa
Tag BCP 47
Skrip
Tulisan tangan didukung
Inggris
en
Latn
Versi prosesor
ID versi
Saluran Rilis
Kolom tambahan terdeteksi
Bahasa tambahan yang didukung
Deskripsi
pretrained-bankstatement-v1.0-2021-08-08
Stabil
Tidak ada
Tidak ada
pretrained-bankstatement-v1.1-2021-08-13
Stabil
Tidak ada
Tidak ada
pretrained-bankstatement-v2.0-2021-12-10
Stabil
Tidak ada
Tidak ada
pretrained-bankstatement-v3.0-2022-05-16
Stabil
Tidak ada
Tidak ada
Versi ini mengasumsikan bahwa file input berisi satu laporan mutasi bank. Tidak seperti versi default, versi ini tidak memeriksa file input untuk laporan mutasi bank dan tidak akan menampilkan error jika tidak ada laporan mutasi bank yang ditemukan.
Jika halaman file input multi-halaman adalah jenis dokumen yang benar dan salah satu versi yang didukung, prosesor akan melakukan ekstraksi entitas pada dokumen pertama yang didukung. Jika tidak menemukan dokumen yang berlaku dalam file input, pemroses akan menampilkan pesan error.
Bahasa yang didukung
Nama Bahasa
Tag BCP 47
Skrip
Tulisan tangan didukung
Inggris
en
Latn
Bentuk/versi yang didukung
2020 (versi standar dan yang disesuaikan)
2019 (versi standar dan kustom)
2018 (versi standar dan yang disesuaikan)
Versi prosesor
ID versi
Saluran Rilis
Kolom tambahan terdeteksi
Bahasa tambahan yang didukung
Deskripsi
pretrained-w2-v1.0-2020-10-01
Stabil
Tidak ada
Tidak ada
pretrained-w2-v1.1-2022-01-27
Stabil
Tidak ada
Tidak ada
pretrained-w2-v1.2-2022-01-28
Stabil
Menampilkan kolom
AllocatedTips
ControlNumber
DependentCareBenefits
EIN
EmployeeAddress
EmployeeName
EmployerNameAndAddress
EmployerStateIdNumber_Line1
FederalIncomeTaxWithheld
FormYear
LocalIncomeTax_Line1
LocalityName_Line1
LocalWagesTipsEtc_Line1
MedicareTaxWithheld
MedicareWagesAndTips
NonqualifiedPlans
SocialSecurityTaxWithheld
SocialSecurityTips
SocialSecurityWages
SSN
State_Line1
StateIncomeTax_Line1
StateWagesTipsEtc_Line1
WagesTipsOtherCompensation
Tidak ada
Peningkatan kualitas dan mendukung kolom baru; tidak termasuk pemisah.
Peningkatan kualitas dan dukungan untuk kolom kotak 12 serta prediksi terperinci EmployeeName, EmployeeAddress, dan EmployerNameAndAddress, yang semuanya tidak lagi menjadi bagian dari output dan diganti dengan kolom tambahan.
Fitur Deteksi Duplikat Online saat ini diproses di pusat data AS. Dukungan regional dan multi-regional tidak tersedia untuk fitur ini di luar Amerika Serikat.
Prosesor ini didukung oleh algoritma yang lebih sering diperbarui daripada versi prosesor baru yang dirilis. Karena alasan ini, prosesor mungkin menampilkan output yang berbeda dari waktu ke waktu meskipun menggunakan versi prosesor yang sama. Misalnya, sistem Deteksi Duplikat Online memantau gambar yang ada di web. Perilaku sistem kemudian dapat berubah lebih cepat daripada yang dapat dilacak dalam versi prosesor.
Lihat catatan tentang Responsible AI[†] dan Peninjauan manual.[‡]
Bahasa yang didukung
Nama Bahasa
Tag BCP 47
Skrip
Tulisan tangan didukung
Inggris
en
Latn
Bentuk/versi yang didukung
Dukungan untuk paspor, kartu izin, dan surat izin mengemudi Amerika Serikat.
Jika dokumen input multi-halaman berisi lebih dari satu slip gaji yang valid, pemroses hanya akan mengekstrak entitas dari slip gaji pertama yang valid. Jika tidak ada slip gaji yang ditemukan dalam file input, pemroses akan menampilkan pesan error.
Bahasa yang didukung
Nama Bahasa
Tag BCP 47
Skrip
Tulisan tangan didukung
Inggris
en
Latn
Versi prosesor
ID versi
Saluran Rilis
Kolom tambahan terdeteksi
Bahasa tambahan yang didukung
Deskripsi
pretrained-paystub-v1.0-2021-03-19
Stabil
Tidak ada
Tidak ada
pretrained-paystub-v1.1-2021-08-13
Stabil
Menampilkan kolom
net_pay
net_pay_ytd
employee_account_number
Tidak ada
Peningkatan kualitas dan dukungan kolom baru;
pretrained-paystub-v1.2-2021-12-10
Stabil
Tidak ada
Tidak ada
pretrained-paystub-v2.0-2022-05-17
Kandidat Rilis
Menampilkan kolom
deduction_item
deduction_item/deduction_type
deduction_item/deduction_this_period
deduction_item/deduction_ytd
direct_deposit_item
direct_deposit_item/direct_deposit
direct_deposit_item/employee_account_number
earning_item
earning_item/earning_type
earning_item/earning_rate
earning_item/earning_hours
earning_item/earning_this_period
earning_item/earning_ytd
page_number
tax_item
tax_item/tax_type
tax_item/tax_this_period
tax_item/tax_ytd
federal_additional_tax
federal_allowance
federal_marital_status
state_additional_tax
state_allowance
state_marital_status
Tidak ada
Versi ini mengasumsikan bahwa file input berisi satu slip gaji. Tidak seperti versi default, versi ini tidak memeriksa file input untuk slip gaji dan tidak akan menampilkan error jika tidak ada slip gaji yang ditemukan.
Peningkatan kualitas, dukungan kolom baru, dan skema baru. Bonus, Komisi, Hari Libur, Lembur, Gaji Reguler, dan Liburan kini menjadi bagian dari earning_item/earning_this_period, dan versi tahun berjalannya ada di earning_item/earning_ytd. Setoran Langsung dan Nomor Akun Karyawan kini disusun bertingkat di bagian direct_deposit_item.
Mengekstrak teks dan nilai dari invoice seperti nomor invoice, nama pemasok, jumlah invoice, jumlah pajak, tanggal invoice, tanggal jatuh tempo.
Parser invoice mengekstrak kolom header dan item baris, seperti nomor invoice, nama pemasok, jumlah invoice, jumlah pajak, tanggal invoice, tanggal jatuh tempo, dan jumlah item baris.
[*] Pemroses ini hanya tersedia untuk pelanggan dengan akses terbatas.
Untuk meminta akses API, isi dan kirim
formulir permintaan pelanggan akses
terbatas Document AI.
Formulir tersebut meminta informasi tentang Anda, perusahaan Anda, dan kasus penggunaan Anda.
Perhatikan bahwa Project ID Google Cloud diperlukan untuk mendapatkan akses.
Untuk membuat project Google Cloud baru atau mengidentifikasi Project ID
dari project Anda yang sudah ada, lihat
petunjuk berikut.
Setelah Anda mengirimkan formulir, tim Document AI akan
meninjau permintaan Anda untuk memastikan Anda memenuhi kriteria akses.
Jika disetujui, Anda akan menerima email berisi petunjuk tentang cara mengakses
dan menggunakan fitur ini.
[†]
Pemeriksaan Dokumen Identitas berfungsi untuk mengekstrak dan mengevaluasi informasi dari dokumen tanda pengenal yang berkontribusi untuk mengidentifikasi apakah gambar input merepresentasikan tanda pengenal yang autentik.
Di Google Cloud, kami memprioritaskan untuk membantu pelanggan mengembangkan dan mengimplementasikan solusi AI dengan aman, dan Identity Proofing telah dikembangkan sesuai dengan Prinsip AI Google.
Berdasarkan Prinsip AI Google dan desain produk saat ini, sebaiknya gunakan kehati-hatian dan evaluasi dengan cermat potensi manfaat dan risiko penggunaan Verifikasi Dokumen Identitas untuk hal berikut:
Pengambilan keputusan tanpa campur tangan manusia untuk prediksi yang dapat memengaruhi hak asasi manusia.
Dalam domain sensitif, termasuk, tetapi tidak terbatas pada, pekerjaan, akses ke layanan publik, layanan kesehatan, dan konteks yang sangat penting bagi keselamatan.
[‡] Selalu gunakan Identity Proofing sebagai bagian dari proses dan alur kerja deteksi identitas yang lebih luas.
Anda harus memiliki peninjau manual dalam alur kerja untuk memverifikasi apakah sinyal yang diprediksi akurat. Pemroses Identity Proofing tidak dimaksudkan untuk menggantikan peninjauan ID oleh manusia dalam alur kerja, tetapi untuk membantu peninjau manusia dalam memvalidasi dokumen tanda pengenal. Pemroses Identity Proofing tidak boleh digunakan sebagai alat pengambilan keputusan otomatis untuk menentukan apakah tanda pengenal valid. Dengan peninjauan manual, pelanggan dapat mencapai akurasi pemrosesan dokumen yang lebih tinggi dan membantu bisnis mengevaluasi prediksi menggunakan alat yang dibuat khusus untuk mendukung peninjauan tersebut.
Pastikan Anda meninjau peraturan di wilayah tempat Anda menerapkan teknologi ini, dan pelajari panduan industri yang ada untuk mempelajari pedoman kebijakan dan masalah keadilan yang umum. Baca tentang keadilan dalam machine learning, termasuk cara mengurangi bias dalam set data pelatihan, mengevaluasi model kustom Anda untuk mendeteksi kesenjangan performa, dan pertimbangan lainnya saat Anda menggunakan model kustom Anda.
Sebaiknya pelanggan mempertimbangkan keadilan, penafsiran, serta praktik terbaik privasi dan keamanan saat menerapkan Verifikasi Identitas. Untuk mempelajari lebih lanjut cara menerapkan responsible AI, baca rekomendasi Google untuk praktik Responsible AI.
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Sulit dipahami","hardToUnderstand","thumb-down"],["Informasi atau kode contoh salah","incorrectInformationOrSampleCode","thumb-down"],["Informasi/contoh yang saya butuhkan tidak ada","missingTheInformationSamplesINeed","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2025-01-24 UTC."],[],[]]