OCR – nosná technologie digitalizace

Publikováno
March 2023
Odebírejte naše novinky
Thank you! Your submission has been received!
Oops! Something went wrong while submitting the form.
Častokrát jsme dostali otázku od zákazníka nebo obchodního partnera – „jaká je úspěšnost OCR“? Dnes si dovolím odpovědět exaktně…

Optické rozpoznávání znaků či OCR je metoda, která zajišťuje zpracování strojově psaného textu z elektronického obrazu. Takzvané OCRko je dnes velmi používanou technologií. Dokonce, je tato technologie i zdarma. Zde si dovolím použít otřepanou frázi „co nic nestojí, za nic nestojí“. Co dnes OCRko musí splňovat, aby bylo v praxi použitelné:

  • Přijmout elektronický obraz z emailu nebo souborového systému
  • Spustit OCR technologii nad dokumenty
  • Dodat výsledek předat do systému, který vytvoří ze znaků metadata k dokumentu
  • Vytvořit prohledávatelné PDF a metadat ve standardním formátu (xml, csv, txt)
  • Musí to být serverová instance
  • Uživatelsky přístupná, pro případnou korekci, lépe řečeno opravu OCR chyb nebo chybných informací na dokumentu
  • Nesmí licenčně limitovat uživatele.

Jaká je tedy dnes úspěšnost OCR?

..úspěšnost OCR od INFOMATICu na softwarové platformě MetaServer je +95%.

Důkaz místo slibů:

Kvalitní OCR zajišťuje automatizaci dokumentů. Systém správně přiřadí metadata, která definují dokument. Tedy dávájí dokumentům „duši“ a je možné dále s dokumenty pracovat a dohledávat je. Každý core systém firmy nebo organizace, tj. BPM /DMS / ERP / CRM potřebuje dokumenty, která obsahují metadata. A buď metadata dáte core systému manuálně nebo automatizovaně.

Správná cesta k digitalizaci je konzultace s námi, abychom našli řešení a nehledali technologii.

David Večeřa
david.vecera@infomatic.cz