minidjvu

Z thewoodcraft.org
Stránka byla naposledy editována 18.8.2023

Je nástroj, kterým je určen ke konverzi černobílých bitmapových souborů. Výsledný DjVu soubor bude mít pouze vrstvu typu Sjbz (viz Anatomie DjVu souborů).

Použití minidjvu

minidjvu [ volby ] vstupní_soubor [ výstupní_soubor ]
Na vstupu akceptuje pouze černobílé soubory soubory ve formátu BMP, PBM (pouze raw, nikoliv ASCII!) a TIFF

Volby

Příklady použití

Utilitu minidjvu lze ho využít např. v situaci, kdy chceme doplnit textovou vrstvu u DjVu stránky, která kombinuje text s obrázky – např. u naskenovaného komixu. Při zpracování barevného obrázku, včetně pozadí, se u černobílé masky nedají odfiltrovat artefakty obrázku, protože by tím došlo k narušení vrstvy popředí. Řešením je v takovém situace vyexportování černobílé masky do souboru bw.pbm

$ minidjvu comix.djvu bw.pbm

A po odstranění všech artefaktů co patří k obrázku – v souboru bw.pbm ponecháme pouze text – uděláme komverzi do DjVu souboru comix-text.djvu, na který násleně aplikujeme ocrodjvu

$ minidjvu bw.pbm comix-text.djvu
$ ocrodjvu --e tesseract -l eng --in-place comix-text.djvu

Textovou vrstvu pak vyexportujeme pomocí nástroje djvutool do souboru ve formátu .dsed, který lze převést pomocí … do .hocr formátu a následně importovat.

djvutool mis11-001.pbm.djvu export dsed-txt