Digitalizace dokumentů v amatérských podmínkách

Z thewoodcraft.org
Stránka byla naposledy editována ..

Digitální kopii knihy, obrazu či jiného dokumentu lze získat mnoha způsoby. Na jedné straně široké škály použitelných zařízení je kvalitní knižní skener a na té druhé fotoaparát v mobilním telefonu.

Poznámka Vestavěné fotoaparáty[1] i relativně levných modelů mobilních telefonů dnešní doby již kvalitou pořízeného snímku překonávají i první generace profesionálních digitálních fotoaparátů. Bohužel klíčovým nedostatkem mobilního telefonu je, že pokud není umístěn na stativu, tak se nedá zachovat konstatní pozice snímacího čipu vůči stránce. Ovšem zde se dočtete jak lze i takto pořízený snímek použít k vytvoření poměrně slušné digitální kopie.

Pro skenování knih jsou optimální knižní skenery. Digitalizovaná kniha je během skenování umístěna do speciální kolébky, pootevřená v optimálním úhlu a nasvícená tak, aby digitální kopie byla zachycena v přirozené barvě – jako kdybychom prohlíželi dokument za denního světla.

Některé knižní skenery umožňují do jednoho souboru zkombinovat i snímky pod různým nasvícením – světlo jiné vlnové délky může zachytit informaci, která by jinak byla pouhým okem neviditelná.

Plochý skener

Před třiceti lety patřily skenery mezi drahá zařízení[2] . V současné době lze koupit kvalitní profesionální plochý skener do 20 tisíc Kč. Výhodou takového skeneru je, že na něm lze digitalizovat také negativy a diapozitivy.

Pokud chcete digitalizovat pouze volné dokumenty, nebo takové co není problém rozevřít na 180°, splní svůj účel i levný plochý skener v ceně do 2 tisíc Kč. Důležité je aby:

  • měl dobré podání barev
  • zvládal alespoň 300dpi v RGB
  • na skle neměl škrábance, fleky a nečistotu
  • a převody nebyly vychozené a vytahané

Pro digitalizaci vázaných knih se klasické ploché skenery nehodí, protože rozevřením knihy na 180° se ničí její vazba a na digitální kopii vznikají nežádoucí stíny a deformace. Tomu lze zamezit pouze tím, že se kniha rozebere na jednotlivé stránky a pak se po naskenování nechá znovu svázat. Což ovšem absolutně nepřichází v úvahu jde-li o vzácné originály či knihy vypůjčené.

Také se připravte se na to, že použití plochého skeneru je poměrně zdlouhavé. Naskenování jedné stránky trvá od 2 do 10 vteřin (v závislosti na zvoleném rozlišení) a hromadu času zabijete při odstraňování nedostatků kterým se tak jako tak nelze vyhnout – oprava natočení stránek a jejich ořezání.

Knižní skener

Knižní skenery pro snímání obrazu technologii plochých skenerů už dávno nepoužívají – místo snímacích diod se k digitalizaci obrazu používají – fotoaparáty.

Ty nejlacinější knižní skenery netvoří v podstatě nic jiného, než rameno s fotoaparátem. Ty lepší (a dražší) používají fotoaparáty dva, natočené tak, aby každý z nich byl kolmo ke snímané stráce knihy, umístěné na podstavci ve tvaru V a fotí obě stránky současně. Profesionální knižní skenery bývají navíc vybaveny automatickým zařízením na otáčení stránek a případně i přítlačným proskleným klínem, aby stránky byly snímané rovnoměrně.

Proto je zpracování knih na knižním skeneru mnohonásobně rychlejší, vůči knize šetrnější. A i zpracování skenů do finální elektronické podoby výrazně jednodušší a rychlejší. Ovšem ceny i těch nejlacinějších knižních skenerů jdou od 40 tisíc Kč výš a ceny těch profesionálních se pohybují ve statisících.

Nicméně pokud vlastníte alespoň kvalitní fotoaparát a stativ, můžete zaimprovizovat.

Improvizovaný knižní skener

Potřebujete…

  • Pracovní stůl – na který bude možné pomocí lepící pásky zafixovat kartónové lože pro uložení digitalizované knihy
  • Lože pro fixaci rozevřené knihy – Improvizované lože lze vyrobit z kartónové krabice, kterou důkladně slepíte lepící páskou a poté diagonálně rozříznete tak, abyste získali dva klíny. Tyto klíny postavte na stůl tak, aby vzdálenost mezi nimi odpovídala šířce hřbetu digitalizované knihy a zafixujte lepící páskou k pracovnímu stolu.
  • Rovnoměrné osvětlení – je velmi důležité, protože při nerovnoměrném osvětlení stránek budete muset věnovat více času postprocessingu.
  • Fotoaparát se stativem – ideální je, kvalitní fotoaparát ke kterému lze připojit vzdálenou spoušť a u kterého lze fixovat zaostření a korigovat barvu osvětlení. Optická osa fotoaparátu by měla být ideálně kolmo vůči stránce. U knižních skenerů to zajištuje pevná konstrukce. V amatérských podmínkách použijte stativ, který můžete rovněž zafixovat lepicí páskou k pracovnímu stolu.
  • Skleněnou tabulku – kterou můžete přimáčknout snímanou stránku tak, aby byla ideálně rovná. Ještě lepší je, když můžete stránky přitisknout pomocí klínu.

Improvizovaný knižní skener I když skenování nepůjde tak rychle jako u plnotučného knižního skeneru, bude i s tímto improvizovaným zařízením efektivita vaší práce lepší, než kdybyste použili klasický plochý skener.

Osvětlení

Základem pro získání kvalitního snímku je osvětlení. V nouzi lze použít obyčejná světla, pokud možno co nejvýkonnější, ale pokud se toho do budoucna chystáte digitalizovat víc, tak se rozhodně do osvětlení vyplatí investovat.

Problémy, způsobené nedostatečným nasvícením:

  • Nerovnoměrná barva pozadí a písma
  • Odlesky a stíny

Nastavení fotoaparátu vůči stránce

Pokud není osa fotoaparátu kolmá vůči stránce, dojde při snímání k deformaci stránky. Je třeba si ohlídat nejenom to, aby byl fotoaparát ideálně v ose, ale také aby jeho náklon odpovídal úhlu pod kterým je otevřená snímaná stránka.

Vhodnou pomůckou je krejčovský příložník.

Doporučuji na lože pod knihu přilepit (např. pomocí oboustranné lepicí pásky) vytištěnou čtvercovou mřížku (SVG soubor ke stažení zde) a stránky snímat tak, aby byla na okrajích stránky vidět. Tato mřížka pomůže nejenom s nastavením objektivu fotoaparátu vůči snímané ploše, ale i s korekcí barev a natočení stránky. Jelikož je rozměr jednoho pole mřížky známý, lze s její pomocí po ořezání snadno upravit také velikost ořezaných stránek tak, aby odpovídala skutečnosti.

Při digitalizaci dokumentů pomocí fotoaparátu vstupují do hry faktory, které se při digitalizaci pomocí plochého skeneru nevyskytují.

  • Především dochází k deformaci nasnímaného obrazu, která závisí nejenom na vlastnostech použitého objektivu, ale také na přiblížení (optická deformace) a umístění stránky vůči jeho ose (perspektiva).
  • Stejně tak se může měnit nastavení barev.

Naštěstí se dají tyto chyby – pokud je při snímání použita tato mřížka – dodatečně ošetřit na úrovni software.

Korekce snímku

Zdali bude nutná korekce perspektivy a případně i zkreslení objektivu, záleží na přiblížení a postavení fotoaparátu.


Přiblížení (optický zoom) má vliv na to, kolik se uloží užitečných dat. Při velkém přiblížení se jich uloží nejvíc, ale směrem k okraji snímku se může projevit deformace způsobená vlastnostmi objektivu (soudkovitost).

Také může být viditelnější vliv perspektivní deformace, pokud nebyl objektiv postaven skutečně kolmo ke snímané ploše.

Soudkovitost

Soudkovitost se projevuje u každého objektivu. Je tím větší, čím kratší je ohnisková vzdálenost. U Gimpu ji lze dodatečně zkorigovat pomocí filtru Lens Distortion, pokud si po ustavení fotoaparátu vyfotíte nejprve plochu kolébky s mřížkou.

Upozornění Soudkovitou deformaci je nutné korigovat jako první! Ještě před korekcí perspektivy, natočením stránky atp.

Perspektiva

Také perspektivu lze v Gimpu zkorigovat. Pomocí Nástroje → Nástroje zkreslení → 3D Transform

Natočení a posun stránky

Při snímání je prakticky nemožné se vyvarovat natočení a posunu stránky a mnohdy je posunutý i originál. Proto je třeba, před ořezáním snímku srovnat stránky podle vodítek. Viz první fáze přípravy dokumentu k ořezání

Vyvážení bílé barvy

Pokud se stránky snímají fotoaparátem nastaveným na automatiku, může docházet k posunu hodnoty bílé barvy.

Obzvláště při menším přiblížení, kdy se zabírá i okolí. Menší přiblížení znamená i větší množství hluchých dat, kterých se zbavíte až po ořezání. Na druhou stranu se tím při správném ustavení fotoaparátu minimalizuje vliv optické deformace objektivu (soudkovitost), takže pak nevadí je-li snímaný dokument vůči výchozí pozici mírně posunutý.

Vyvážení bílé barvy můžete udělat buď automaticky (Barvy → Automatika → Vyvážení bílé), nebo manuálně, tím že v dialogu Barvy → Úrovně vyberete pomocí kapátka barvu bodu, která se má ve výsledku považovat za bílou.

Bude to snadné, pokud použijete výše uvedenou mřížku. Stačí kliknout do libovolného bílého čtverečku. Výhodou je, že výsledek tohoto výběru můžete rovnou vidět a případně korigovat, dokud nebude bílá na mřížce taková, jaká má být.

Velikost stránky

Mřížku využijete i ke korekci velikosti nasnímaného dokumentu. Při konverzi do DjVu se obvykle předpokládá, že má dokument 300 DPI, tj. že úsečka o délce 300 pixelů odpovídá vzdálenosti jednoho palce.

Správnou velikost dokumentu tedy (po jeho ořezání) nastavíte tak, že v dialogu … nastavíte 300 DPI, a buď do X nebo Y dosadíte skutečnou velikost. Tu můžete zjistit z mřížky na pozadí před oříznutím stránky.

Oprava nerovnoměrného osvětlení

Pokud nemáte kvalitní osvětlení, nebo je předloha nafocená z ruky při špatném osvětlení, či jde o sken z plochého skeneru, kde se vždy projevuje ohyb u hřbetu jako stín, můžete vytáhnout text popředí pomocí masky viz jak postupovat při korekci barev a čištění dokumentu.

Postup při digitalizaci

Se snímáním začněte od obálky. Postupně nasnímejte nejprve liché stránky. Pak knuhu otočte, a začněte snímat stránky sudé. Při snímání sudých stránek je doporučeno postupovat odzadu.


  1. Mobilní telefon vlastním od září 1996. Na VŠ mě kvůli tomu považovali za snoba a ťukali si na čelo, když jsem se r. 1999 nechal slyšet, že můj další telefon již bude s fotoaparátem. První modely takových telefonů se totiž objevily až r. 2000 v Japonsku a boom mobilních telefonů s foťákem nastal ještě později. Roku 2007 začal Apple prodávat svůj iPhone první generace, ale skutečně masové rozšíření modelů s fotoaparátem sebou přinesly až po r. 2009 telefony s Androidem, protože byly levné a mnoha typů.
  2. K práci s počítači jsem se dostal právě díky tomu, že mne počátkem 90-tých let zaujaly možnosti výpočetní techniky při tvorbě dokumentů a jejich následné archivace a distribuce v digitalizové formě. První dokumenty jsem psal na Didaktiku a tisknul na jehličkové tiskárně. Abych mohl převádět obrázky z papírové formy do počítače, koupil jsem r. 1994 ruční, jednořádkový skener Geniscan GS-105. Byl to jeden z prvních skenerů. Zvládal pouze 256 odstínů šedi a navíc ho bylo možné připojit pouze k PC na kterém byl DOS. Mockrát jsem ho tedy nevyužil, protože jsem ho měl u kamaráda co takový stroj vlastnil.