fbpx Jaký je rozdíl mezi OCR a ICR? | EXON
Zpět na seznam článků Rady a Tipy z digitální kanceláře
Jaký je rozdíl mezi OCR a ICR? EXON článek.

Jaký je rozdíl mezi OCR a ICR?

OCR (optical character recognition) a ICR (intelligent character recognition) systémy se využívají na vytěžování dat, což je klíčová část digitalizace. Tyto systémy nám umožňují z obrázku dokumentu získat text a dále s ním pracovat, například kopírovat či vyhledávat.

Oba systémy jsou si podobné. Hlavním rozdílem je účel těchto systémů. OCR byl navržen zejména na dokumenty tištěné či psané na stroji. Oproti tomu ICR je navržen především na ručně psané texty. ICR je rozšířenou formou OCR. Systémy OCR je rovněž schopen rozpoznat ručně psaný text, avšak přesnost tohoto rozpoznání značně klesá.


Jak fungují OCR a ICR systémy?

Systém OCR opticky rozpoznává znaky z obrázku dokumentu a za pomocí algoritmů jim přiřadí znak. Po primárním rozpoznání znaků následuje analýza, kdy systém kontroluje chyby (znaky u kterých není vysoká pravděpodobnost shody) a využívá k tomu vlastností daného jazyka, každý jazyk má danou pravděpodobnost výskytu kombinací určitých písmen vedle sebe. OCR je využiváno např. při vytěžování faktur.

Systém ICR pracuje na bázi neuronových sítí, což navíc umožňuje systému se učit různé typy písma ručně psaného textu na základě zkušenosti, podobnosti, ale také kontextu. Systém rozpozná, jakým stylem daná osoba píše, což mu umožní lépe rozpoznat další znaky. Znamená to, že s každou další stránkou je přesnost a kvalita rozpoznání vyšší.

EXON pracuje na vývoji technologie pro vytěžování ručně psaného písma na bázi umělé inteligence. Více o projektu InkCapture.


Výše zmíňený nástroj InkCapture je zaměřený na rozpoznávání ručně psaného písma včetně efektivního vyhledávání v ručně psaných textech. Na obrázku je pro ukázku znázorněna identifikace textu a extrakce informací z rukopisu z roku 1917. Pro učení ICR se jednotlivé texty tzv. anotují. Postupně učíme umělou inteligenci znát ručně psané dokumenty.

Ukázka anotace dat.

Anotace dat z ručně psaného písma (zdroj: Autor: Jan Sommer. Dostupné z: Flickr.com, získáno 25.3.2021)
Autor článku: Petr Polanský


 

Více článků od společnosti EXON


 

Pro více informací nás kontaktujte