Perilaku pemisah dokumen
Output pemroses pemisah berisi informasi pemisahan untuk dokumen input, termasuk
skor keyakinan. Document AI API menghasilkan
objek JSON Document
, dan format output
menggunakan kolom entities
untuk
mewakili pemisahan dokumen. Informasi tambahan bergantung pada jenis pemisah
tertentu.
Entity.type
menentukan klasifikasi dokumen. Untuk mengetahui daftar lengkap jenis dokumen yang dapat diidentifikasi, lihat daftar berikut.Entity.pageAnchor.pageRefs[]
menentukan halaman yang berisi setiap sub-dokumen. Perhatikan bahwapageRefs[].page
berbasis nol dan merupakan indeks ke kolomdocument.pages[]
.
Pemisah tidak dirancang untuk memisahkan dokumen logis yang panjangnya lebih dari 30 halaman. Dokumen logis yang panjangnya lebih dari 30 halaman (misalnya, laporan mutasi rekening bank 40 halaman) dapat dibagi menjadi dua dokumen atau lebih dan diklasifikasikan secara terpisah.
Pemisah mengidentifikasi batas halaman, tetapi tidak benar-benar memisahkan dokumen input untuk Anda. SDK Toolbox Document AI menyediakan fungsi utilitas yang dapat memisahkan dokumen input berdasarkan output dari pemroses pemisah.
Jenis dokumen diidentifikasi
[1] Parser yang sesuai untuk formulir ini tidak mendukung jenis dokumen ini. Artinya, pemisah dapat mengidentifikasi dan mengklasifikasikan dokumen jenis ini, tetapi Document AI tidak menyediakan parser untuk mengekstrak informasi.
Contoh output
Prosesor | Contoh output |
---|
Contoh Kode
Pemisah mengidentifikasi batas halaman, tetapi tidak benar-benar memisahkan dokumen input untuk Anda. Anda dapat menggunakan Toolbox Document AI untuk memisahkan file PDF secara fisik menggunakan batas halaman. Contoh kode berikut mencetak rentang halaman tanpa memisahkan PDF:
Java
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Java Document AI.
Untuk melakukan autentikasi ke Document AI, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Node.js
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Node.js Document AI.
Untuk melakukan autentikasi ke Document AI, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Python
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Python Document AI.
Untuk melakukan autentikasi ke Document AI, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.
Document
yang diproses.
Python
Untuk mengetahui informasi selengkapnya, lihat dokumentasi referensi API Python Document AI.
Untuk melakukan autentikasi ke Document AI, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.