ocr – Xorp Blog Podcast

Aki kicsit is irodai környezetben és papír alapú adminisztrációban él nap mint nap, az jól ismeri a különböző jobb és kevésbé jobb szövegfelismerő alkalmazásokat. A közismert neve eme alkalmazásoknak az OCR (Optical character recognition). Emlékszem még, amikor számlákat a HR-ek, szép nagy BMP-kbe vagy TIFF-ekbe scanneltek és mentettek. Azóta kicsit változott a világ és az egységesítés és mérethatékonyság miatt a PDF file formátumot kezdték favorizálni. Ez nagyon jó dolog, viszont a PDF mit se ér, ha egy bazi nagy kép van benne és nem szöveg. Arra se keresni nem lehet, se megfelelő részeket kimásolni szükség esetén.
„OCRKit – Szöveg felismerés kép alapú PDFből” olvasásának folytatása →