t Novinky

Proč je 300 dpi pro OCR standard?

Skenování v rozlišení 300 dpi (bodů na palec) není oficiálně standard pro OCR (optické rozpoznávání znaků), ale je považován za zlatý standard.

Skenování při nižším dpi, například 200 dpi, a následné použití softwaru pro zvýšení rozlišení pomocí interpolace (proces počítačového dopočítání a doplnění pixelů za cílem zvětšení) není zcela vhodné, protože neposkytuje optické zlepšení rozpoznávání znaků. Obvykle se jen obrázek zvětší a to díky přidání extra pixelů navíc. Tento způsob zpracování je ale už pouze odhad, váš obrázek tak vždy ztratí na čistotě a kvalitě. Lepší je začít skenováním dokumentu při rozlišení 300 dpi.

Většina OCR a softwarových společností vám doporučuje skenování při minimálním rozlišením 300 bodů na palec a mají to jako výchozí nastavení. Jinými slovy, za každý čtvereční centimetr papíru skener zachycuje 300 bodů horizontálně a 300 bodů svisle, tj. 90000 bodů celkem. Používáte-li 200 dpi nastavení namísto 300 dpi, uvidíte pouze 40000 bodů na čtvereční palec a to je velký rozdíl.

Proto tedy vyšší rozlišení skenování zajištuje lepší přesnost OCR.
Níže je uveden příklad, kde písmeno neobsahuje dostatek bodů na palec a může tak pro software působit jako číslo 8.