pindai text dari gambar online OCR
Aplikasi berbasis web Optical Character Recognition (OCR) layanan yang memungkinkan Anda untuk mengkonversi dokumen PDF dan memindai gambar dan mengenali karakter text untuk dapat dicopy ke Word, Teks, Excel, PDF, Html output format.
Sebelumnya kita berbagi penderitaan dulu neh, mungkin pernah dapet file PDF yang gak bisa dicopy textnya ini bisa karena proteksi atau file pdf yang terbuat dari hasil scan images. atau berbentuk hardcopy beberapa lembar kertas yang textnya perlu anda salin ke ms.word/notepad anda.
yup.., “masa harus diketik manual sih…” ini mungkin kalimat yang gak asing dari penderitaan itu pada umumnya.
Ada berbagai tools untuk dapat mengenali karakter text dari file images atau pdf. menggunakan teknologi OCR (Optical Character Recognition).
bagaimana kalau tulis tanggan ? atau gambarnya buram.. ya tentu saja hal tersebut akan mempengaruhi. belom lagi masalah unicode. Beberapa perangkat lunak OCR juga menempatkan melalui spell checker untuk “menebak” kata-kata yang tidak diakui. 100% akurasi sulit dicapai, setidaknya perjuangan untuk mendapatkan hasil yang optimal.
kalau mau lebih jelas detailnya bisa dilihat di OCR wiki http://en.wikipedia.org/wiki/Optical_character_recognition
disana juga ada link software OCR umumnya komersil.
Selain OCR menggunakan Microsoft OneNote 2007 & Microsoft Office Document Imaging, ada juga yang gratisan SimpleOCR(14 day free trial), TopOCR, JOCR atau FreeOCR.
kalau mau gak pake install2an bisa yang online di http://www.onlineocr.net/ lebih mantapnya silahkan dicoba.
Hasil testing sama tools freeOCR.net dengan file yang sama, online OCR lebih akurat walau masih ada yang ngelantur. gak tau masalah languagenya ato gimana.. di freeOcr.net beberapa huruf h jadi n, trus a jadi e. mungkin nanti bisa dicoba review & benchmark dari berbagai tools diatas.
Aplikasi berbasis web Optical Character Recognition (OCR) layanan yang memungkinkan Anda untuk mengkonversi dokumen PDF dan memindai gambar dan mengenali karakter text untuk dapat dicopy ke Word, Teks, Excel, PDF, Html output format.
Sebelumnya kita berbagi penderitaan dulu neh, mungkin pernah dapet file PDF yang gak bisa dicopy textnya ini bisa karena proteksi atau file pdf yang terbuat dari hasil scan images. atau berbentuk hardcopy beberapa lembar kertas yang textnya perlu anda salin ke ms.word/notepad anda. Baca Selanjutnya
