Logo produktu KAITOS.

KAITOS - umělá inteligence do knihoven
software pro digitalizaci kulturního dědictví

Moderní řešení pro digitalizaci kulturního dědictví, postavené na nejnovějších poznatcích v oblasti umělé inteligence a vybavené pro práci s velkým objemem dat.

Kaitos je profesionální software, který komplexně umožňuje digitalizaci kulturního obsahu, jako jsou monografie, rukopisy, periodika, staré tisky, staré mapy a další vzácné zdroje. Je vyvinut pro potřeby univerzit, knihoven, muzea nebo digitalizačních jednotek po celém světě.

Kaitos poskytuje kompletní nástroje pro digitalizaci knihovních, archivních a muzejních sbírek podle aktuálních standardů a lze jej snadno přizpůsobit konkrétním potřebám jednotlivých institucí. Vestavěná workflow a řada automatizačních prvků předurčují systém pro produktivní využití v digitalizačních projektech libovolného rozsahu.

Logo produktu KAITOS.

Jádrem softwaru jsou neuronové sítě, které digitalizují, označují a extrahují informace z dokumentů kulturního dědictví. Umělá inteligence celý proces automatizuje. Nahrazuje činnosti, které dříve byly zpracovány zásadně manuálně. Kaitos nahrazuje ořez, rovnání textu a zpracování metadat(OCR) automatizovanými procesy. Umělá inteligence umožní člověku vytvořit velké množství metadat.

Výstupem je vytvořit balíček dle standardů NDK (Národní digitální knihovny). Cílem je nahradit lidskou práci, manuální zpracování.

Klíčové vlastnosti KAITOS

  • Detekce skenování
  • Pre-processing / klasifikace typu stránky. Rozpoznání typu stran.
  • Automatický ořez stránky a narovnání.
  • Extrakce textu (OCR). OCR vrstva pomáhá vytvořit prohledatelné soubory.
  • Strukturování a ukládání extrahovaných informací ve standardních formátech.
  • Generování PSP balíčků (Producer Sbmission Package).

Vyvíjené řešení promítne umělou inteligenci a strojové učení do oblasti detekce a předzpracování skenů, klasifikace typů stran, analýz rozložení obsahu dokumentu, úpravy ořezu a vyrovnání, vytěžení textového obsahu strany (OCR), indexace obsahu strany (OLR) a pro efektivnější vyhledávání a v neposlední řadě i strukturování a uložení vytěžených informací do standardních formátů (generování PSP).

Kaitos je postaven na umělé inteligenci. Jsou využity konvoluční a rekurentní neuronové sítě. Konvoluční sítě dosahují v oblasti rozpoznávání obrazu dosud nevídaných výsledků v mnoha oblastech. Ať už se jedná o klasifikaci obrázků, detekci objektů, čtení textů či rozpoznávání obličejů a dalších. V některých případech dokonce překonávají úspěšnost lidí. Pro účely čtení textů se často rovněž využívají tzv. rekurentní neuronové sítě (konkrétně LSTM), které jsou díky vnitřní reprezentaci stavu vhodné pro rozpoznávání sekvencí.


Software pro digitalizaci kulturního dědictví