Vytěžování dokumentů, převážně faktur, je stále aktuální téma. I po roce 2020. A pravděpodobně tu s námi vytěžování ještě nějaký čas bude. Digitalizace sice postupně nabírá na síle, nicméně praxe naznačuje, že ještě hodně let budeme kombinovat papírové a elektronické dokumenty. Pojďme se mezitím podívat na typy dokumentů, které lze vytěžovat.
Vytěžování dat dle struktury dokumentu
Rozlišujeme 3 typy dokumentu dle struktury: strukturované, polostrukturované a nestrukturované.
Strukturované: „víme co a víme kde“
Jedná se o dokumenty s fixní strukturou, kde přesně víme, co a kde se nachází. Text nalezneme vždy tam, kde má být. Typicky se jedná o formuláře, do kterých zapisujeme jedno písmeno či číslici, například žádanky nebo daňová přiznání. Dalším příkladem jsou formuláře, které zákazníci ručně vyplňují pro využití benefitů zákaznické karty. Tyto formuláře vytěžujeme a zpracováváme na digitalizačním pracovišti formou outsourcingu. Pokud vytěžujeme ručně psaný text, jde o tzv. ICR typ vytěžování. Úspěšnost vytěžení je oproti tištěnému textu mírně nižší.
Více o projektu pro Penny Market.
Polostrukturované: „víme co, ale nevíme kde“
U tohoto typu víme, že data se na dokumentu nacházejí, ale nevíme přesně na jakém místě. Typické dokumenty jsou faktury a objednávky, ale sem patří i velké technické průkazy, které mají specifickou strukturu a barevnost. Přesto je úspěšnost vytěžení velmi vysoká. Příklad: projekt pro Mercedes-Benz Financial Services, kde velké technické průkazy úspěšně vytěžujeme.
Nestrukturované: „nevíme co, ani kde“
U těchto dokumentů netušíme, co obsahují, ani kde se data nachází. Často je používají instituce typu pojišťovny a banky pro zpracování došlé pošty. Tento trend však posiluje i v komerční sféře. Na základě roztřídění systém pozná typ dokumentu, např. reklamace, žádost, smlouva apod. V tomto odvětví se rozmáhají systémy s umělou inteligencí, které výrazně zvyšují úspěšnost vytěžení a mají obrovskou budoucnost. I my tyto systémy postupně vyvíjíme.
Jakmile si odpovíme na otázku, jaké typy dokumentů potřebujeme vytěžovat, teprve poté můžeme vybrat vhodnou technologii.
Více o vytěžování dat a digitalizaci faktur.
Comments
NEVÁHEJTE,
KONTAKTUJTE
NÁS.
Máte zájem o další informace nebo o nabídku pro vaši konkrétní situaci?
Kontaktujte nás pro více informací.