Definisi OCR

Kita dapat melihat bahwa tidak hanya pemindai yang mampu mengenali huruf dan jenis.

Kita dapat melihat bahwa tidak hanya pemindai yang mampu mengenali huruf dan jenis.

OCR atau Optical Character Recognition, diterjemahkan ke dalam bahasa Spanyol, adalah teknologi yang bertujuan untuk meniru mata manusia, teknologi ini mencoba untuk mencapai pengenalan karakter piksel demi piksel dan jenis font (jenis huruf) yang digunakan untuk membuat font. . Kita berbicara tentang pemindai biasa dan perangkat lunak yang cukup kuat. Ketika kita merujuk ke perangkat lunak yang kuat, yang kita maksud adalah basis data yang besar dan luas untuk dapat mengenali berbagai huruf dan jenis yang sesuai.

Selain perangkat lunak, pemindai juga penting. Pemindai yang sangat sensitif akan membaca piksel dokumen dengan lebih baik karena sensitivitas ini akan membantu perangkat lunak membuat lebih sedikit kesalahan. Cukup sulit bagi perangkat lunak untuk tidak membuat kesalahan. Dokumen apa pun ditempatkan di pemindai dan keluar dalam format Word atau dalam format yang dapat Anda pilih oleh program. Setelah ini, Anda harus memperbaiki dokumen. Setelah diperbaiki, kita dapat memasukkannya ke dalam pdf untuk dibagikan atau diarsipkan.

Salah satu kegunaan besar OCR adalah dalam pemindaian buku. Misalnya koleksi perpustakaan nasional. Demikian juga dengan e.book terkenal yang dapat dibaca di mana saja di iPad dan tablet android serta pembaca e- book .

Contoh bagaimana sebuah buku dipindai.

Contoh bagaimana sebuah buku dipindai.

Teknologi OCR memiliki keterbatasan. Ini tidak berfungsi untuk teks lama atau karena alasan tertentu telah mengalami kerusakan fisik. Kemerosotan ini sangat lumrah jika menyangkut dokumen sejarah yang usianya bisa mencapai seribu tahun. Jenis dokumen ini, yang bertahun-tahun telah memakan korban, tidak dapat dikenali oleh teknologi OCR yang bersangkutan. Jenis dokumen ini biasanya diarsipkan dengan pemindaian resolusi tinggi dalam format fotografi sehingga publik dapat mengagumi semua detail dokumen tanpa merusaknya. Resolusi dalam OCR memberi tahu kita seberapa banyak detail yang dideteksi oleh sistem itu sendiri. Untuk teks yang jelas dan terdefinisi, hal yang normal adalah menggunakan 300 dpi (dots per inch). Ini dikonfigurasi dari pemindai. Satu inci sama dengan 25.400 milimeter, jadi 300 piksel untuk area sekecil itu sudah cukup. Dalam hal surat kabar atau sejenisnya. di mana cetakannya kecil dan kertasnya selalu sedikit usang, resolusi optimalnya adalah 600 dpi. Jika kita memindai pada resolusi terakhir ini, lebih baik bagi kita untuk memiliki pemindai yang baik karena membutuhkan banyak biaya untuk pemindai biasa untuk menyelesaikan tindakan pada resolusi ini.

evolusi dari OCR berjalan melalui perbaikan sistem ini. Perbaikan yang sudah berlangsung dalam proyek yang disebut IMPACT. Proyek ini bertujuan untuk berbagi informasi antara berbagai lembaga negara dan perusahaan untuk mengembangkan perangkat lunak OCR yang memenuhi semua persyaratan untuk digitalisasi massal.

Topik dalam OCR

Menarik lainnya

© 2023 Pengertian.Apa-itu.NET