Планшетний, планетарний і сканер на основі ЦФК: порівняння і методи сканування
Переклад книги і будь-якого іншого зшитого документа в електронний вигляд припускає вирішення декількох завдань: безпосередньо сканування, обробка отриманих зображень, їх подальша компоновка у файл і, в деяких випадках, оптичне розпізнавання тексту (ОРС). Для сканування книг використовується 3 типи сканерів: планшетний, планетарний і сканер на основі цифрових фотокамер. Нижче представлені порівняльні характеристики трьох типів сканерів і програмного забезпечення, що поставляється з ними, на різних етапах створення електронної книги. I. Отримання електронних образів сканованого документа Планшетним сканером є планшет, усередині якого під прозорим склом розташований скануючий механізм. Невеликий за розміром (підходить для будинку або офісу), дуже простий в експлуатації, запускається натисненням однієї кнопки, проте не модернізується і швидко застаріває. Формат сканування - не більш А4, швидкість - 300 стр./час, дозвіл отримуваних зображень - 2400 dpi і вище (оптичне). Сканер призначений для оцифрування розшитих документів; при скануванні нерозшитих виникають проблеми із спотворенням зображень. Оскільки сторінки перегораються уручну, проблеми виникають і при постійній зміні позиції книги, що утрудняє подальшу обробку з допомогою ПО. Планшетний сканер підходить для оцифрування щодо нових видань, оскільки старі найчастіше не піддаються розшиванню у зв'язку з культурною або юридичною значущістю. При сильному згинанні корінця книги є вірогідність пошкодити крихке видання. Що ж до якості отримуваних зображення - оскільки освітлення не досягає затемненої області у корінців книги, якість зображення залишає бажати кращого. Середня ціна планшетного сканера - від 1500 крб. Планетарний сканер відрізняється скануючою головкою, розташованою зверху, на значному видаленні від сканованого документа і педаллю для управління. Займає багато робочого простору і не модернізується. Формат сканування - A2-a4, швидкість - 400-700 стр./час, дозвіл зображень на виході - 400-600 dpi (середнє – 400 dpi. У більшості планетарних сканерів (окрім Zeutschel і CMA) збільшення дозволу досягається інтерполяцією програмним способом, що приводить до сильної втрати якості). Сканер призначений для оцифрування як зшитих, так і розшитих видань - і щодо нових, і старих видань. Проте в останньому випадку все ж таки є вірогідність пошкодити корінець книги, оскільки видання має бути розгорнене повністю, на 180 градусів. Частина моделей оснащена притискним склом, у останніх контакт між сканованим виданням і скануючим елементом відсутній. Сканована книга залишається в одній і тій же позиції, не дивлячись на те, що сканування проводиться уручну. Відсутня і проблема із затемненою областю, оскільки скановані зображення повністю освітлені. Ціна планетарного книжкового сканера - від 600 000 крб. Книжковий канер на основі ЦФК - підвид планетарний. Призначений для оцифрування як зшитих, так і розшитих видань, він підходить для оцифрування як щодо нових, так і старих видань за рахунок спеціальної V-образной колиски, що дозволяє не розкривати книгу повністю (на 90 градусів), що зводить до мінімуму шкідливу дію на видання. Швидкість сканування - 500-700 стр./час, формат - A2-a4, зображення на виході отримують оптичний дозвіл 130-470 dpi і відмінна якість за рахунок повного освітлення зображень. Перегортання сторінок здійснюється уручну (існують моделі з автоматичним перегортанням, проте цінні, старі книги, складові основу бібліотечного фонду, не рекомендується оцифровувати на такому устаткуванні щоб уникнути пошкоджень). Сканер займає багато робочого простору, проте практично не схильний до поломок, оскільки є скануючою платформою. Запускається натисненням однієї кнопки. Модернізується за рахунок заміни фотокамер на професіональніші варіанти. Початкова ціна такого книжкового сканера - 395 300 крб. II. Обробка отриманих зображень У всіх книжкових сканерів, що беруть участь в порівнянні, є загальний мінус — зображення, отримані від будь-якого з них, вимагають коректування відповідно до оригіналу, приведення до одного і тому ж вигляду, усунення спотворень, вирівнювання з допомогою ПО (зазвичай додається до сканера), що і є другим етапом створення електронної книги. Найчастіше дані операції виконуються в пакетному режимі — параметри обробки виставляються для першої сторінки, а потім застосовуються до всіх останніх. Основні проблеми, що виникають при скануванні книг: Планшетний сканер - Освітлення сканера не досягає затемненої області у корінця книги, навіть якщо використовується редукуюча лінза великої різкості; інформація, що потрапила в дану область, не відновлюється з допомогою ПО. - Необхідно, щоб скановане видання залишалося в одному і тому ж положенні, інакше операторові доведеться займатися обрізанням сторінок уручну, оскільки налаштування пакетного режиму не підійдуть до всіх сторінок; розпізнавання тексту надалі проводитиметься з втратою якості. Решеніє:- Ретельно стежити за тим, щоб скановане видання знаходилося паралельно межам сканера. Використовувати ПО для усунення іськаженійпланетарний ськанеросновной проблемою вважається велика кількість спотворень. Їх кількість мінімізується, але не усувається повністю, за рахунок притискного скла, використовуваного в деяких моделях планетарних сканерів. Рішення: Використовувати ПО для усунення спотворень. Незручність полягає в дуже низькій швидкості обробки зображень, за рахунок чого значно знижується загальна швидкість сканування книг цим типом сканерів. Книжковий сканер на основі цифрових фотоаппаратовеффект " Margin crawl ", обумовлений товщиною паперу видання, примушує зображення у міру сканування небагато просуватися по горизонталі. Рішення: При пост-обработке зображень міняти налаштування того, що кадрується кожні 100-200 сторінок. III. Оптичне розпізнавання символів, компоновка файлу електронної книги з можливістю редагування і повнотекстового пошуку Якщо ж говорити про точність розпізнавання символів, то порівняння зображень найвищої якості від сканера на основі ЦФК планшетного і планетарного сканерів за допомогою Abbyy Finereader V.8 Professional Edition показав, що найбільш оптимальним варіантом є книжковий сканер з V-образной колискою - його точність складає 99,66%, тоді як планшетний і планетарний сканер видають 90,42% і 91,59% відповідно. Як вивід можна відзначити, що кожен з порівнюваних пристроїв має свої достоїнства і недоліки; вибір оптимального рішення залежить від можливості розшивання документа, його стану (відносне нове або старе видання), вимог до отримуваного файлу електронної книги і багатьох інших умов.
atiz. ru
|
|