Příprava XCF souboru pro konverzi do DjVu

Z thewoodcraft.org
Přejít na: navigace, hledání

Většina dokumentů, které jsou k nalezení na tomto webu - obrázky, DjVu soubory, PDF soubory, atp. je zpracována pomocí open source nástrojů. Nejenom proto, že open source je woodcraftu velice blízký z principiálního hlediska, ale především proto, že nabízí mnohem víc možností řešení problému, aniž by bylo nutné vynakládat další finanční částky za použití licencovaných komponent.

V následujícím postupu chci na konkrétním příkladu uvést, jakým způsobem připravuji XCF soubor, vhodný ke konverzi do DjVu souboru. Jakým způsobem s XCF souborem dále pracovat, je uvedeno v článku o Zpracování PDF bez textové vrstvy do DjVu souboru s textovou vrstvou

Výchozí sken

Optimální výchozí surovinou pro další zpracování el. dokumentu je plnobarevný sken, s minimální hustotou 300 dpi.

Čím méně dpi a barev, tím méně dostupných informací, na kterých závisí kvalita výsledného produktu.

Jak skenovat?

V dnešní době, není nezbytně nutné mít k dispozici profesionální skener. Důležité je aby:

  • měl dobré podání barev
  • zvládal alespoň 300dpi v RGB
  • na skle neměl škrábance, fleky a nečistotu
  • a převody nebyly vychozené a vytahané

Tzv. knižní skenery při snímání nepoužívají mechanické převody vůbec - ve skutečnosti jsou v hlavě skeneru zabudované dva fotoaparáty, které fotí obě strany současně. Ptoto je zpracování knih na knižním skeneru mnohonásobně rychlejší, a také šetrnější. Neboť kvalitnější knižní skenery mají hlavy pootočené tak, aby byly kolmo na stránky knihy umístěné na podstavci ve tvaru V.

Profesionální knižní skenery bývají navíc vybaveny automatickým zařízením na otáčení stránek a případně i přítlačným proskleným klínem, aby stránky byly snímané rovnoměrně.

Klasický plochý skener, je spíš z nouze ctnost - jediné plus u těch kvalitnějších spočívá v možnosti snímat také transparentní materiál (diapozitivy a negativy).

V krajní nouzi lze dnes místo skeneru použít pro získání materiálu vhodného pro další zpracování i snímek z mobilního telefonu.

Vytvoření výchozího XCF souboru

Surové skeny, lze mít uložené jako samostatné obrázky, nebo ve vícestránkových formátech jako je TIFF nebo PDF. Výhodnější je ale z nich co nejdříve udělat XCF dokument, se kterým lze dále pracovat podle libosti a času.

Formát XCF není vícestránkový, ale podporuje vrstvy. Tzn. že při otevření vícestránkového dokumentu (TIFF, PDF), nebo formátu který pracuje s rámci (MNG, GIF) se naimportují jednotlivé stránky (či rámce) jako vrstvy.

Pokud vytváříme XCF soubor ze samostatných obrázků, je třeba použít z menu volbu Otevřít jako vrstvy, a následně vybrat příslušné obrázky.

1, fáze - Nastavení vodítek

První operací, kterou je třeba provést je nastavení vodítek. To lze u GIMPu provést zcela jednoduše "vytažením" vodítek z horní (horizontální vodítko) a postranní (vertikální vodítko) lišty s měřítkem.

Vodítek může být klidně více. Je třeba nastavit je tak, aby vymezovaly oblast do níž se má vejít textový obsah.

doc set guides.png

Výchozím bodem pro následující operace s vrstvami bude optimálně zvolený průsečík. Na něj bude mnohem snazší - s ohledem na "přilnavost" vodítek - umísťovat výchozí bod rotace.

2, fáze - Duplikace, přejmenování a setřídění vrstev

Každá stránka je zastoupena jednou vrstvou. Pro lepší orientaci, je vhodné změnit pojmenování vrstev tak, aby název vrstvy odpovídal číslu stránky kterou obsahuje.

doc rename layer.png

Pokud jsou naskenované dvoustránky, je třeba nejprve provést duplikaci takové vrstvy, a každou z nich očíslovat podle stránky, kterou bude po finálním oříznutí obsahovat.

Při duplikaci a pojmenování vrstev nezáleží na tom zdali jsou vrstvy "zamčeny", nebo ne.

3, fáze - Přesun a rotace vrstvy

Po přejmenování a setřídění vrstev tak aby šly za sebou odshora dolů, můžeme přistoupit k jejich zpracování.

To spočívá především ze dvou následujících operací:

Přesun 
Je vůbec první nutný krok. Obzvláště, pokud jde o duplikát dvoustrany, kdy je nutné přemístit obsah stránky tak aby se vešel mezi nastavená vodítka.
doc move layer.png
Rotace 
Při skenování na plochém skeneru se stává velice často, že jsou stránky naopak - v takovém případě je lepší stránky překlopit tak aby byly správně orientované již při přejmenovávání vrstev. Ovšem jiná situace nastává pokud jsou "pouze" pootočené. V takovém případě je třeba nejprve stránku přesunout tak, aby byl bot rotace optimálně na průsečíku vodítek. Pak můžeme začít s rotací.
doc rotate layer.png
Po volbě transformace vrstvy pootočením o libovolný, předem neznámý úhel, se objeví mřížka, která zabírá celou plochu vrstvy, která má uprostřed bod rotace. Ten lze uchopit a přesunout do průsečíku vodítek, kolem kterého se má vrstva otáčet.
doc set rotation.png
Teprve poté můžeme přistoupit k rotaci. Stránku natáčíme tak dlouho až je obsah srovnaný. Srovnat jej můžeme buď podle řádku, nebo podle levého či pravého okraje textového bloku. Záleží na obsahu. Někdy je zarovnáván k dolnímu okraji, jindy zase k hornímu. Je to různé.
Poznámka Při těchto operacích dávejte pozor, abyste měli aktivní viditelnou vrstvu, která je v zásobníku nejvýš. Abyste se pak nedivili, že se obsah stránky netočí a neposouvá.
Upozornění Také si hlídejte, aby vrstva se kterou aktuálně pracujete nebyla "zamčená". Zámek ve skutečnosti znamená, že je vrstva svázaná s ostatními "zamčenými" vrstvami. Tzn., že pokud necháte takovou stránku rotovat, budou zároveň natočeny i všechny ostatní svázané stránky. naštěstí lze v takových přípedech operaci vrátit zpět, ovšem obzvláště v případě dokumentů s větším množstvím stránek může taková operace zabrat docela dost času aniž by ji bylo možné přerušit.

4, fáze - Postupné zpracování dalších vrstev (stránek)

Po natočení a usazení vrstvy, tak aby byl obsah mezi vodítky postupně pokračujeme ve zpracování dalších vrstev. Zpracované vrstvy postupně zamykáme a nastavujeme jako skryté. Přitom však nesmíme zapomínat označit jako aktivní nejvyšší viditelnou vrstvu s níž hodláme pracovat.

doc set layer.png

Po zpracování všech vrstev můžeme nastavit další vodítka, jimiž vymezíme také vnější okraje stránek, podle kterých následně provedeme ořez.

5, fáze - Ořezání stránek

Vodítka podle kterých provedeme ořez by měla být zvolena tak, aby při tom nedošlo k nechtěnému oříznutí obsahu.

doc before crop.png

Před oříznutím doporučuji mít skryté všechny vrstvy a postupně pak jednu po druhé zviditelnit a skrýt - a při tom překontrolovat, jestli vodítka nezasahují do stránky víc než je nutné.

doc after crop.png

Po oříznutí dokumentu je vhodné vrstvy roztáhnout podle plátna a případně přesahující plochy dobarvit pomocí razítka, tak aby plocha pozadí byla pokud možno jednolitá, a zároveň vyretušovat skvrny které by mohly komplikovat OCR.

Takto upravený dokument je připraven pro další zpracování.

Výhody XCF

Výhodou XCF je, že proces zpracování můžeme přerušit a dokument uložit v libovolné fázi zpracování a pokračovat v práci později.