Полная версия страницы  English  

+ Миниопрос по формату DjVu

Sergeant, 25.03.2004 12:02
Всем Привет.
Хочу провести маленький опрос по формату DjVu.
Поскольку формат допускает разные опции то хочу выяснить следущие вопросы:
1. Считаете ли вы необходимым включать в DjVu OCR, которое позволяет вести поиск по файлу и paste/copy функции?
Включение OCR увеличивает размер файлов на 1-2 Mb.
2. Наивысший коэфициент сжатия достигается на ч/б изображениях, а не на серых и цветных. Но на ч/б изображениях пропадают детали картинок. Что вам важней размер или качество?
3. Включать ли в книги на русском OCR?
Напимер, можно выпустить Delux версию Ген. инженирии Рыбчина 2 из.
4. Удовлетворены ли вы качеством, которое можно достич в DjVu?
5. видети ли Вы пользу от гиперлинкового оглавления или эта фича бесполезна?

О формате djvu написано здесь.
Mykhaylo, 25.03.2004 12:26
1. OCR от Gencho Genchev? Иногда полезно, но IMHO только в больших книгах и справочниках. А 1-2 Мб на 12 опять же IMHO не критично.
2. grey комфортнее и для чтения и иногда разпознать что-то надо. Я укрфармакопею сканировал повторно из-за самоуверености smile.gif А вот цвет нужен либо в атласах или на нек страницах где к примеру метаболич. пути по разному выглядят
3. ??? переводить? Или с русских источников?
4. При таком размере - да, хотя tiff естественее smile.gif
5. Полезна и весьма
Sergeant, 25.03.2004 12:39
2 Mykhaylo
>>>хотя tiff естественее
Я когда недавно книгу готовил, промежуточные TIFF файлы (не сжатые)сожрали
30 GB (!!!) на моем винчестере eek.gif . В финале около 20 Mb cool.gif .
Mykhaylo, 25.03.2004 13:18
2 Sergeant
>>TIFF файлы (не сжатые)сожрали 30 GB (!!!) на моем винчестере . >>В финале около 20 Mb .

Поэтому на безрыбье и рак рыба. Недостатки у Djvu есть, но всяко это на сегодня лучше. Может матиматики еще чего придумают - будем сильнее сжимать. Но сейчас IMHO оптимизацией программ никто не хочет заниматься - вот и выходят Word-ы всякие на 2-3 компакта frown.gif
Вот DVD пошли в серию, потом инет Т1 не будет диковинкой, а потом свет чик и полный паралич
Sergeant, 25.03.2004 13:32
Смысл мини опроса понять, что надо людям. А то сканим, конвертим, раздаем и все это потом как в черную дыру уходит. нужен feedback .
musand, 25.03.2004 13:43
по мне так ОКР , весчь полезная, но мне поиска по оглавлению ,как правило, вполне хватает, поетому гиперссылки в оглавлении очень да$е помагают.
на счет книг на русском.. хм.. почти не читаю


[Текст переведён с транслита]
Sergeant, 25.03.2004 14:56
>>>на счет книг на русском.. хм.. почти не читаю

Это зря. Научные книги на русском читать очень вредно.
А вот классику.... smile.gif
Anonymous, 25.03.2004 15:44
1. OCR нужен. Как можно обойтись без поиска по словам? Когда пробовал вывести одну страницу DjVu на печать, то ничего не получилась.
2. Там, где текст можно оставить черно-белое изображение. Там, где рисунки - цветное
3. Включать поиск везде.
4. Качество DjVu неплохое, но листать страницы не удобно. В этом смысле формат pdf лучше. Еще лучше сканировать и переводить в текст, но, наверное, это очень долго.
5. Оглавление с линками - это удобно, особенно, когда оно большое и книга толстая.
Sergeant, 25.03.2004 16:53
>>>Еще лучше сканировать и переводить в текст, но, наверное, это очень долго.

Не просто долго, а мучительно муторно потом править текст.
Рискну сказать, что полностью делать распознанный текст ПЛОХО.
Для общепознавательной книги это еще пройдет. До для протоколов это фатально. Даже при тщательной правке останется много ошибок, а для протокола важна неукоснительная точность. Есть еще промежуточный вариант делать pdf в FineReader, но размер по сравнению с DjVu в 6-8 раз больше, а качество практически одиноково.
>>> Когда пробовал вывести одну страницу DjVu на печать, то ничего не получилась.

Никогда не было такой проблеммы. Странно.
musand, 25.03.2004 19:38
Автор - Сергеант:
&гт;&гт;&гт;на счет книг на русском.. хм.. почти не читаю

Это зря. Научные книги на русском читать очень вредно.
А вот классику....    smile.gif 
так я о научных толкую, а классику.. еe в переплете читать надо.. чтоб странички полистать... аромат понюхать smile.gif


[Текст переведён с транслита]
Sergeant, 25.03.2004 19:48
>>>а классику.. еe в переплете читать надо.. чтоб странички полистать... аромат понюхать
Это я тоже люблю.
Но при нашей кочевой жизни бумажная книга становится анахронизмом.
К сожалению, очень не практично тоскать с собой по миру библиотеку.
Я принаровился читать на Palme. часов на 7 хватает без подзарядки. качаю с lib.ru
правдо последние месяца два не удалось прочитать ни одной книги.
Жена отобрала и не отдает.
Mike Klemin, 26.03.2004 18:30
Я не понимаю, что за OCR такой включится? Не нужно ли будет при сканирование распознавать текст в таком случае?
Sergeant, 26.03.2004 20:26
2 Mike Klemin
Сейчас есть два пути включения OCR в DjVu.
1. Использует Document Express . В нем есть функция оптического распознавания. Никаких функций управления процессом не предусмотрено. По моему модули расрознавания лицензированы e Guneinform. А качество их намного хуже файнридера. Не поддерживается кириллица. Зато все просто. Запустил, выпил коффе и готовый результат.
2. Распознавание через Файнридер. И импорт в DjVu с помощью утилит от Генчо Генчева. Главный недостаток - тредуется сноровка.
Mike Klemin, 26.03.2004 21:18
а смысл импортировать в дежавю уже отосиеренный текст, проще его в ртф тогда или даже в xml
Viacheslav, 29.04.2004 03:08
А я с DjVu большие проблемы имею, на работе не могу поставить плагин для просмотра, прав нет. Вот и мучаюсь с IrfanView frown.gif PDF-как-то привычнее smile.gif
Anonymous, 30.04.2004 13:19
Согласна с Viacheslav.Не везде поставишь плагин.Поэтому неудобно смотреть на рабочем месте.И листается хреновато-это факт. PDF в этом плане гораздо практичнее.
Anonymous, 01.05.2004 04:57
прошу прошения- это я тута "баловался".
больше не буду!!!
Все-таки книга с оцр - это уже не простро книга, а больше smile.gif .
Мультимедия smile.gif Можно, например, поиск сделать по нужному слову
- cool.
Что касается "Распознавание через Файнридер", то как раз тут-то
все просто. Я загружаю тиффы в Файнридер, запускаю заспознавание и оставляю на ночь (у меня Атлон 800 ). Утром все по рецептуре http://www.cqham.ru/djvu_ocr.htm (внизу файлы пакета - это просто bat файлы).
Раз, два, три и тест - все!!! И пдф есть, и дежавю.
Всем приятно отдохнуть!
Это — лёгкая версия форума. Чтобы попасть на полную, щелкните здесь.
Invision Power Board © 2001-2012 Invision Power Services, Inc.