Přihlášení

Jméno

Heslo



Zapomněli jste heslo?
Pro zaslání nového
Klikněte sem.

Tým Lektorů

Ing. Adéla Kolouchová
Milan Kypr, tester
Hanka Najtová, ECDL
Ing. Tomáš Fajt, tester
Vladimír Pištěcký, ECDL
Stefan Vorálek
Boris Dvořáček, metodik

Rychlé info

Pro přidání zprávy do Rychlého infa, musíte být přihlášeni.

Žádné zprávy.

Převádějte černotiskové dokumenty do elektronické podoby efektivně

Milí přátelé,

Na úvod mi prosím dovolte, aby jsem za odbornou konzultaci poděkoval panu Milanu Kyprovi, bez jehož laskavosti a pomoci by tento článek nemohl vzniknout. Vroucně Ti Milane Děkuji.

 

V tomto článku by jsem se s Vámi velmi rád podělil o postupy, které jsem vědecky ověřil a jsou zaručenými metodami, které Vám umožní dosáhnout při převodu černotiskových dokumentů do elektronické podoby profesionálních výsledků s minimem nutných finančních investic.

Protože zde hovořím o elektronickém převodu černotiskových dokumentů, je nutné uvézt, že se nejprve zmíním o tom, jak skenované černotiskové dokumenty pokud možno bezeztrátově uložit do jednoho z podporovaných grafických formátů. V článku uvádím v průběhu popisu přímé odkazy ke stažení potřebného software. Takže si budete moci mnou vysvětlované postupy v praxi ověřit a vyzkoušet.

 

Před vlastním skenováním

Je nutné si nejprve uvědomit, že kvalitu uloženého obrazu determinuje celá řada faktorů. Mezi ně patří.

1. Jak je tištěná předloha položena na skleněnou desku scanneru

2. Je předloha zaprášená.

3. Jsou stránky vyhlazené, nebo pomuchlané, mírně prohnuté na krajích v důsledku nesprávného uskladnění tištěné předlohy.

4. Jakou tiskovou technologií byla tištěná předloha vyhotovena?

 

Jakmile si odpovíme na tyto otázky, můžeme začít s vlastním skenováním. Z výše uvedených otázek vyplívá, že nejlepších kvalit dosáhneme, pokud bude tištěná předloha vyhotovena na profesionálním tiskovém zařízení, tedy s využitím tiskáren, které jsou k dispozici u odborných tiskařských firem, dobré výsledky však dosáhnete i skenováním tištěné předlohy, která byla vytištěna na inkoustové tiskárně.

Takže než začnete skenovat knihu, tak stránky ofoukejte proudem vzduchu, aby byly bez nadbytečných prachových částeček.

Vyčistěte si skleněnou desku scanneru, aby neobsahovala šmouhy a otisky prstů. Tyto grafické objekty na skle nejsou vůbec žádoucí, citlivé kamery scanneru totiž snímají i tyto objekty na skleněné desce.

Jak vyčistit skleněnou desku svého scanneru se dočtete v návodu k obsluze, často se nedoporučuje používat abrazivní čistící prostředky, tekutina pro čištění se nesmí nalévat na skleněnou desku, tekutinu bývá nutné nanést na čistící hadřík, ten by měl být hebounký a jemný. Ale více zjistíte v manuálu ke scanneru.

Když máme skleněnou desku vyčištěnou, stránky v knize zbaveny prachu a jiných možných nečistot, můžeme přejít k dalšímu čtení.

Při skenování pozor na poškození vazby knihy. Nezapomeňme prosím, že aby byla kvalita skenovaného obrazu dokumentu co nejoptimálnější, je zapotřebí stránky nebo stránku přitlačit na skleněnou desku scanneru. Stránka knihy by měla ležet na skleněné desce stejným způsobem, jako by se jednalo o stránku samostatnou, o stránku, která není součástí knihy. Toto se nám samozřejmě zcela nepodaří, pokud bychom nechtěli stránky odborně vytrhávat z vazby, pokládat na skleněnou desku scanneru a přikrýt poklopem scanneru. Ale alespoň se o to při skenování snažme.

Dejme tomu, že už máme prvou stránku, nebo dvojstranu na skleněné ploše, scanner máme propojen s počítačem, potřebný ovladač scanneru nám pracuje s jádrem operačního systému bez nesnází. Zbývá jen vybrat vhodnou aplikaci, s jejíž pomocí můžeme zahájit proces převodu tištěného dokumentu do jeho elektronické, přesněji řečeno do jeho obrazové podoby.

Před tímto procesem je nutné si uvědomit, že volba vhodného grafického formátu je klíčovou volbou. Výběr vhodného grafického formátu, v němž bude obraz skenované předlohy zaznamenán je stěžejním faktorem, který určuje skutečnost, do jaké míry bude obraz co nejhodnověrnější originální předloze.

Proto Vám doporučuji použít buďto formát .tiff nebo formát .png. Formát .png patří mezi takzvané bezeztrátové grafické formáty.

Pro naskenování tištěné předlohy Vám vřele doporučuji použít buďto program Microsoft document Imaging a jeho funkci skenovat nový dokument v menu soubor, nebo je také možné použít program XnView.

Ať už budete chtít zachovat pouze obrazovou podobu tištěné předlohy, nebo budete-li chtít později naskenovanou tištěnou předlohu převézt do textové podoby pomocí OCR, zapamatujte si několik důležitých zásad.

Čím vyšší rozlišovací schopnost scanneru nastavíte, tím větší budou výsledné soubory a tím pomaleji se bude skenovací hlava posunovat pod skleněnou deskou scanneru. Pokud skenujete barevnou předlohu, nastavte typ předvolby skenovaného dokumentu na barevný. Pozor! Pokud budete chtít skenovat barevný dokument a rozpoznávat jej pomocí OCR, nastavte předvolbu skenovat ve stupních šedi. Toto nastavení se mi osvědčilo i při skenování černobílých černotiskových předloh.

Při tomto nastavení budete mít naprostou jistotu, že předlohu bude možné komfortně předčítat z obrazovky, pokud jí převedete do jednoho z bezeztrátových grafických formátů.

Přičemž při skenování platí, že někdy je lepší skenovat déle a nepokládat na skleněnou desku scanneru 2 stránky současně. Dbejte při skenování na to, aby byla předloha vždy na skleněné desce dobře napnutá, rovná a aby předloha částí nevyčnívala mimo oblast skleněné desky.

A na závěr si řekněme, jak naše obrazy předloh ukládat do PDF.

K tomuto účelu si stáhněte virtuální tiskárnu, která pracuje i ve 64 bitových Windows.

Instalátor této skvělé virtuální tiskárny a konvertoru do .pdf formátu získáte s využitím zde

Po dokončení instalace se Vám tato pomyslná tiskárna přidá do seznamu tiskáren. Po dokončení skenování můžete na tuto virtuální tiskárnu obraz předlohy odeslat. Výsledkem bude .pdf soubor, jenž bude obsahovat skenovaný obraz předlohy. Tisknout naskenované stránky můžete s libovolného grafického editoru nebo prohlížeče. Je rovněž možné Bez obtíží využít program Microsoft Office Document Imaging, který je součástí instalace Microsoft Office 2003 Standard pro studenty a učitele.

Protože jsem se tu zmínil o grafickém prohlížeči a skvělém editoru XnView, nemohu Vás „ošidit“ o odkaz ke stažení jeho instalátoru.

Naleznete jej zde

Převod tištěné předlohy do textové podoby

A už je to tu. Na počátku tohoto článku jsem sliboval, že Vám prozradím postup, s jehož pomocí si budete moci profesionálně převézt tištěné předlohy z optické podoby do podoby textové. A jaký OCR engine (OCR jádro) Vám zde chci předvést?

Vřele doporučuji všem majitelům softwarového balíku Microsoft Office Standard Edition 2003, aby pro převod dokumentů do textové podoby používali aplikaci Microsoft Office Document Imaging. Její součástí je výkonný OCR modul, který při správném nastavení předdefinovaných předvoleb pro skenování dovede produkovat bez nadsázky kvalitní dokumenty s minimem překlepů a při exportu do .html dokonce zachovává rozložení a formátování originálního dokumentu. Ačkoli je pravda, že protože nástroj formátuje dokument pro účel jeho prezentování na WWW, může být formátování možná trošinku odlišné od originálu. Ale to nechť posoudí čtenář tohoto článku.

Platí, že OCR nástroj integrovaný do Microsoft Office Document Imaging rozpoznává ty jazyky, pro něž je ve verzi Microsoft Office Standard Edition 2003 standard edition nainstalována podpora pro kontrolu pravopisu.

Angličtina, Čeština, Slovenština, Němčina. No není to skvělé?

Při skenování volte nastavení stupeň šedi, osvědčilo se mi nejen pro rozpoznávání textů v barevných předlohách.

Přeji všem uživatelům, aby se jim dobře skenovalo a věřím, že jim tento článek byl alespoň trochu užitečný.

Se všemi se zdvořile loučím.

Autor článku je:

Mgr. Janusz Chmiel

 

Komentáře

Zatím nikdo nekomentoval. Buďte proto první a vložte svůj komentář.

Přidat komentář

Pro přidání komentáře musíte být přihlášený.

Hodnocení

Pro hodnocení musíte být registrovaný.

Prosím přihlašte se nebo se zaregistrujte.

Zatím nikdo nehodnotil.
Vygenerované za: 0.07 sekund
2,469,980 návštěv