Optikai karakter felismerés (OCR) technológia lehetővé teszi szöveges grafika vagy szkennelt dokumentum szerkesztését. Széles körben használják könyvek és dokumentumok elektronikus fájlokká való konvertálására, irodai nyilvántartási rendszer számítógépesítésére vagy a szöveg közzétételére egy weboldalon.
Az OCR lehetővé teszi a szöveg szerkesztését, keresni egy szót vagy kifejezést, és alkalmazhat olyan technikákat, mint a gépi fordítás, szöveges beszéd és szövegbányászat.
A Microsoft Office tartalmazza a Microsoft Document Imaging OCR-t, azonban számos egyéb ingyenes alternatíva is létezik, amelyek a feladatot is elvégzik, beleértve a szkennerhez vagy az all-in-one eszközhöz mellékelt alkalmazási szoftvert. Lényegében, hogy az OCR segítségével szkennelje át, majd konvertálja a képet szöveggé, a következő lépéseket kell követnie:
- Helyezze a dokumentumot a szkenner ágyra.
- A számítógépen használja a lapolvasó alkalmazói szoftverét és az OCR-t típusként.
- Válassza ki a kívánt területet az OCR-vizsgálat elvégzéséhez, és ellenőrizze az előnézetet.
- Szkennelje és mentse el a szövegfájlt, és bármelyik szövegszerkesztőben szerkesztheti.
Azt is választhatja, hogy telepítené az alkalmazást az OCR végrehajtásához a lapolvasó alapértelmezett programja helyett.
FreeOCR képes beolvasni a legtöbb TWAIN és WIA szkennert, és megnyithatja a beolvasott PDF és többoldalas TIFF képeket is. Az ingyenes OCR tartalmazza a Windows által összeállított Tesseract szabad OCR-t, amely Tesseract GUI néven is ismert. A FreeOCR ingyenes, beleértve a kereskedelmi célú felhasználást is. A FreeOCR a.NET Framework v2.0-t igényli. A FreeOCR v4 hamarosan megjelenik.
Az interneten több ingyenes online szolgáltatás is van, amelyek lehetővé teszik, hogy a képen vagy a beolvasott dokumentumon OCR-t hajtson végre a böngészőben.
- A NewOCR.com egy ingyenes online OCR szolgáltatás. A NewOCR.com elemzi a feltöltött képfájl szövegét, majd a szövegből a szöveget szöveggé alakítja. A szolgáltatás korlátlan feltöltéseket és elrendezési elemzést biztosít (több oszlopú szövegfelismerés). A barátságos szolgáltatás nem igényel regisztrálást, és támogatja a 29 nyelvet, bár az oldal elég alapos és amatőr. A szolgáltatás maximum 5 MB méretű JPEG-, PNG-, GIF-, BMP- és többoldalas TIFF-ot, valamint akár 20 MB-os többoldalas PDF-dokumentumokat is igénybe vehet.
- A Free-OCR.com egy másik szabad online OCR eszköz. Feltöltheti a 2MB-nál nagyobb méretű képfájlokat (JPG, GIF, TIFF BMP vagy PDF), nem lehet szélesebb vagy nagyobb, mint 5000 képpont, és óránként 10 kép feltöltése van. A Free-OCR képes több oszlopos szöveggel kezelni a képeket, és 29 nyelven is támogat. Az egyik furcsa korlátozás az, hogy csak a PDF dokumentum első oldalát veszi igénybe az OCR végrehajtása közben.
- Az ingyenes online OCR szolgáltatás lehetővé teszi szövegek és karakterek felismerését a PDF szkennelt dokumentumokból (beleértve a többoldalas fájlokat is), a fényképek és a digitális fényképezőgép által rögzített képek. Ez lehetővé teszi a felhasználók számára 32 nyelv felismerését többnyelvű dokumentumok felismerésére és közvetlenül többféle formátumba konvertálják, mint a PDF, DOC, XLS, RTF, HTML és TXT. Lehetősége van arra, hogy az OCRed fájlokat online tárolja a biztonságos munkaterületen, vagy töltse le azokat a számítógépére.
Biztos vagyok benne, hogy ez a lista nem kimerítő. Miért nem ad hozzá több ilyen szolgáltatást és alkalmazást, mint megjegyzést ehhez a bejegyzéshez, ha többet tudsz?