Bagaimana untuk menggunakan Tesseract OCR di Jawa

Video.: Demo Document Analytics Rumah AI - AI OCR (ICR) Untuk Contoh Kasus NPWP

Kandungan

Arahan

Tesseract perpustakaan pengiktirafan aksara optik menawarkan pemaju cara untuk mengimbas dokumen dan teks ke dalam imej. Mereka digunakan untuk menyimpan imej dokumen yang anda tidak perlukan lagi di atas kertas. Anda boleh menggunakannya di Jawa dengan membuat gelung kawalan untuk setiap watak dan menulis masing-masing ke fail. Untuk menggunakan perpustakaan Tesseract, anda mesti memasukkan "ruang nama" Java untuk fungsi OCR.

Arahan

Perpustakaan Tesseract membenarkan pengguna mengimbas dokumen mereka (John Foxx / Stockbyte / Getty Images)

Klik kanan fail Java yang anda mahu gunakan untuk membuat dokumen OCR. Klik "Buka Dengan" dan pilih editor Java pilihan anda.
Tambah ruang nama perpustakaan OCR di bahagian atas fail. Salin dan tampal kod berikut ke fail sumber anda:

com.touch.robot.imagecomparison.tesseractocr
Buat kod yang bertanggungjawab untuk mengimbas aksara untuk fail. Sebagai contoh, kod berikut membuat gelung melalui setiap watak dalam fail dan menulisnya ke fail imej:

(I = 1; {i} <{lines} +1; i = {i}) adalah satu set nilai yang ditakrifkan sebagai: +1) {Typeline "{_TOCR_LINE {i}}"}
Klik butang "Simpan" editor dan klik "Run" untuk menjalankan kod tersebut dalam pengompilasi Java.