Még 2011 végén teszt jelleggel elkészült egy OCR karakterfelismerő plugin az nvda-hoz, amellyel optikai karakterfelismerést végezhetünk angol nyelvű szövegeken. A Plugin hasznos lehet például olyan pdf fájlok felismertetéséhez, amelyek csak szöveges képet tartalmaznak. Cikkemben bemutatom, hogyan is telepíthetjük ezt a plugint.
- 1. Töltsük le a plugint innen
- 2. A letöltött zip fájlt bontsuk ki. Ha mindent jól csináltunk, akkor létrejött egy ocr mappánk.
- 3. Az ocr mappát (tehát ne a tartalmát) másoljuk be a következő mappába.
windows xp esetén:
c:documents and Settingsfelhasználónevünkapplication datanvdaglobal plugins
windows 7 esetén
C:felhasználókfelhasználónevünkapp dataroamingnvdaglobal plugins
Ahol felhasználónk, oda a saját felhasználónevünknek megfelelő mappát kell kiválasztani, amit a windows telepítésekor adtunk meg.
Ha mindent jól csináltunk, akkor most a global plugins mappán belül van egy ocr mappánk. - 4. Indítsuk újra az nvda-t, ezzel készen is vagyunk
Ha ki szeretnénk próbálni a plugint, nyissunk például meg egy olyan pdf fájlt, ami képet tartalmaz. Miután befejeződött a fájl megnyitása, nyomjuk le az nvda+r billentyűt, ez indítja az ocr felismerést. Az NVDA jelzi is, hogy a felismerés elkezdődött, a következő üzenet hangzik el: „performing OCR”. Ha kész a felismerés, a „done” üzenet hangzik el, és az nvda áttekintő kurzorával fel is olvastathatjuk a felismert szöveget.
Ne várjunk csodákat a plugintól, még fejlesztés alatt áll. Angol szövegeket viszonylag jó hatásfokkal felismertethetünk, a pontos felismeréshez ajánlott az ablakot teljes méretűre állítanunk. Magyar szöveg felismertetése esetén jobb esetben kimaradnak az ékezetes karakterek, rosszabb esetben nem kerül felismerésre a szöveg. Pozitívum, hogy a jaws13 hasonló megoldásához képest ez a plugin tapasztalataim szerint gyorsabban végzi a karakterfelismerést. A Jaws13 az Omnipage motort használja, az NVDA pedig a Tesseract nevű ingyenes karakterfelismerőt.
[A cikket írta:Szakács Máté]
Vélemény, hozzászólás?