Список форумов |  Добавить сообщение |  Правила |  26.11.2024, вторник, 13:23:50
СПИСОК ФОРУМОВ
26.11.2024
09:45 Главная гостевая книга библиотеки(3658)
24.11.2024
16:42 "Разыскиваются книжки", доска объявлений(15475)
20.11.2024
11:47 Обо всем - мнения(3131)
07:16 Русские впечатления о заграничной жизни(9431)
01.10.2024
13:10 Проблемы OCR и электронных библиотек(1967)
09.09.2024
04:35 Книжки, которые скоро будут выложены(47)
06.05.2024
02:06 О возвышенной поэзии(1568)
02.02.2024
15:33 Книжки, которые стоит прочитать(5187)
12.11.2023
00:25 Мнения читателей о дизайне библиотеки(1478)
Lib.Ru

Проблемы OCR и электронных библиотек
Тема форума: В этом форуме обсуждаются общие проблемы связанные с поддержкой электронных библиотек и сканированием книг.

А так же обсуждение статьи Вадима Ершова "О коллективных сайтах"

Отсортировано по [убыванию] [возрастанию]   

СООБЩЕНИЯ ЗА 05.10.2003
372. Lexa, (lexahr@inbox.ru) 13:49:18 [ответить]
      > 364. В.Воблин.
      > Господа, кто уже поработал с седьмой версией ФайнРидера: ваше мнение? Какие на самом деле улучшения вы заметили? (если вообще).
     
      Единственное улучшение, которое я заметил - стал иногда включать одиночную цифру (например, в названии главы) в текстовый блок.
     
      > И очень интересно, есть ли разноца между сканерами по скорости прохода одной страницы при прочих равных улоовиях, замерял ли кто-нибудь этот параметр и что получилось. Я пытался говорить на эту тему с продавцами спец.магазина и ничего от них не услышал толкового на эту тему.
     
      Есть. На моём текущем (UMAX Astra 4500) и предыдущем (Acer ScanPrisa640U) цифры соответственно таковы (для ч/б или grayscale, 300dpi, размер сканируемой области 185мм/240мм): 250 разворотов в час и 110 разворотов в час.


371. Lexa, (lexahr@inbox.ru) 13:42:40 [ответить]
      > 342. textshare.
      > В пятницу купил лицензионный FineReader 7 Professional.
      > Есть предварительное впечатление, что Змей прав, и они снизили уровень проверки и пометки неуверенно распознанных слов и знаков.
      > FR, кажется, стал опасно самостоятелен в выборе вариантов: я 3-4 раза ловил его на том, что он при распознании заменил слово и даже его не пометил, как неуверенно распознанное.
      >
     
      Есть такое. Ещё он почему-то иногда не распознаёт явные переносы, т.е. переносы в словах, которые точно есть в словаре.
     
      > Устранен один маленький но неудобный баг (а может и не баг, а так,неосмотр) - изменение инструмента работы с изображением при переходе от страницы к странице. Например, если я прохожусь по всему пакету и чищу изображения от грязи, виньеток или колонтитулов, то каждый раз после переходп к изображению новой страницы приходилось заново выбирать ластик.
     
      Это было ещё в FR6. Причём, насколько я помню, в триал-версии этой возможности не было. (Или может эта возможность добавилась после установки SP2?)


СООБЩЕНИЯ ЗА 03.10.2003
370. Zmiy, Минск (zmiy@inbox.ru) 14:01:08 [ответить]
      > 368. Эмин.
      > После обработки текста FR6.0 и затем aftescan-ом переносы никогда не соединяются. Приходтся все вручную обрабатывать.
      > Например в тексте было вот так: "исполь-зовать", после обработки получается "исполь зовать". Может кто знает, как сделать так, чтобы автоматически все слова с переносами соединялись, т.е в конечном счете выглядело бы так: "использовать"?
     
      А кто сказал что должно быть "использовать"??? Вдруг в книге герой заикается и там так и написано - "исполь-зовать"? Так нельзя автоматически править!
      После правки текста AfterScan выводит результаты, чего он там направил, в таблицу. Не поленись и пройди по строчкам - проверь, что он направил... Это не так уж и долго...


369. Zmiy, Минск (zmiy@inbox.ru) 13:55:06 [ответить]
      > 367. Эмин.
      > > 366. Zmiy.
      > > Уф...
      > >
      > > CLTXT - ЧИСТКА И СКЛЕЙКА ТЕКСТА ПОСЛЕ FINEREADERА (ВЕР. 2.00)
      >
      > Zmiy, при исполнении программы Виндоуз выдает ошибку "cltxt.exe - обнаружена ошибка. Приложение будет закрыто. Приносим извинения за неудобства.Передайте Microsoft сведения об ошибке. Отправить отчет, НЕ ПЕРЕДАВАТЬ" Система у меня ХР. Что делать?
     
      А readme.txt прочитал? См. раздел "Системные требования"...
      С Office XP (Word XP) программа не будет работать! При проверке слов на дефис/перенос используется вызов спелчекера Wordа. Но работает это только с Word 97/2000, т.к. MS поменяли в Word XP функцию вызова спеллчекера... Я ищу выход из этой ситуации...


368. Эмин, Баку (azeribooks@narod.ru) 13:13:03 [ответить]
      После обработки текста FR6.0 и затем aftescan-ом переносы никогда не соединяются. Приходтся все вручную обрабатывать.
      Например в тексте было вот так: "исполь-зовать", после обработки получается "исполь зовать". Может кто знает, как сделать так, чтобы автоматически все слова с переносами соединялись, т.е в конечном счете выглядело бы так: "использовать"?


367. Эмин, Баку (azeribooks@narod.ru) 09:22:25 [ответить]
      > 366. Zmiy.
      > Уф...
      >
      > CLTXT - ЧИСТКА И СКЛЕЙКА ТЕКСТА ПОСЛЕ FINEREADERА (ВЕР. 2.00)
     
      Zmiy, при исполнении программы Виндоуз выдает ошибку "cltxt.exe - обнаружена ошибка. Приложение будет закрыто. Приносим извинения за неудобства.Передайте Microsoft сведения об ошибке. Отправить отчет, НЕ ПЕРЕДАВАТЬ" Система у меня ХР. Что делать?


366. Zmiy, Минск (zmiy@inbox.ru) 00:29:19 [ответить]
      Уф...
     
      CLTXT - ЧИСТКА И СКЛЕЙКА ТЕКСТА ПОСЛЕ FINEREADERА (ВЕР. 2.00)
     
      ОПИСАНИЕ
     
      Программа предназначена для автоматической чистки и склейки текста, форматированного пробелами и неубранными переносами слов, либо текста после распознования книги в FineReaderе.
      Выходной файл с расширением OUT представляет собой текст в кодировке DOS(ALT), в котором каждая строка - это абзац.
     
     
      ВЫПОЛНЯЕМЫЕ ФУНКЦИИ
     
      - распознование кодировок WIN и DOS(ALT);
      - преобразование в кодовую страницу DOS(ALT);
      - удаление форматирования пробелами;
      - склейка строк в один абзац (абзац = одна строка);
      - склейка страниц;
      - удаление мусора и номеров страниц;
      - коррекция слов с переносами (по русскому словарю MS Word; по текущему тексту; по запросу у пользователя);
      - выделение подстраничных сносок по символу '*' ;
      - коррекция пробелов и знаков препинания;
      - выделение глав, подглав и т.д. переводом строки.
     
     
      Скачать программу можно здесь: http://zmiy.da.ru>http://zmiy.da.ru
      Качаем, пробуем, критикуем...


СООБЩЕНИЯ ЗА 02.10.2003
365. леа, ариель (alkraftmakher@hotmail.com) 18:59:14 [ответить]
      Обратите внимание, что некоторые книги невозможно скачать, например, В.Набоков повесть "Другие берега" и несколько книг Рекса Стаута, начиная с "Убийство по правилам". Может быть найдете время исправить это досадное недоразумение, потому как возможности читать online в интернете у меня нет, возможно и у других читателей тоже. И, кстати, очень неудобно скачивать книги из вашей библиотеки, нужно ждать, пока раскроется файл, потом отправлять его в gzip, куда удобнее скачивать книги в OCR Aldebaran, а выбор там не такой большой как у вас. Пожалуйста, подумайте над тем, как можно было бы читателям с минимальными затратами времени скачивать книги. Всего доброго


364. В.Воблин, 14:31:08 [ответить]
      Господа, кто уже поработал с седьмой версией ФайнРидера: ваше мнение? Какие на самом деле улучшения вы заметили? (если вообще).
     
      И очень интересно, есть ли разноца между сканерами по скорости прохода одной страницы при прочих равных улоовиях, замерял ли кто-нибудь этот параметр и что получилось. Я пытался говорить на эту тему с продавцами спец.магазина и ничего от них не услышал толкового на эту тему.


СООБЩЕНИЯ ЗА 29.09.2003
362. Zmiy, Минск (zmiy@inbox.ru) 10:27:25 [ответить]
      > 361. kvik.
      > Помогите найти драйвера для mustek 12000sp plus (scsi) под 98 windows
     
      Вот тут что-то есть, но больно старое :
      http://www.mustek.com.tw/Download/driv_scanr/europe/12000spplus.html>http://www.mustek.com.tw/Download/driv_scanr/europe/12000spplus.html
     
      Тогда попробуй это :
      http://deck.net.ru/drivers/scanner/Mustek/ScanExpress>http://deck.net.ru/drivers/scanner/Mustek/ScanExpress%2012000SP/
     
      Если нет, то пробуй тут : (только нужно иметь сер.номер сканера)
      http://www.mustek.de/eng_/html/treiber/scanner_scanexpress_scsi.htm>http://www.mustek.de/eng_/html/treiber/scanner_scanexpress_scsi.htm
     
      Или тут, но по-русски : (тоже нужно иметь сер.номер сканера)
      http://www.mustek.ru/products/12000sep.htm>http://www.mustek.ru/products/12000sep.htm
     
      Если нет, тогда пробуй подобрать работающий драйвер на похожий сканер (например, Mustek ScanExpress 1200 III SP) тут :
      http://www.nix.ru/drivers/scanner_mustek.html>http://www.nix.ru/drivers/scanner_mustek.html


СООБЩЕНИЯ ЗА 28.09.2003
361. kvik, Архангельск (vickers@atnet.ru) 13:46:53 [ответить]
      Помогите найти драйвера для mustek 12000sp plus (scsi) под 98 windows


360. kvik, Архангельск (vickers@atnet.ru) 13:45:09 [ответить]
      > 17. Григорий.
      > > 15. Zmiy.
      > > Вопрос ко всем :
      > > Q: У кого какой сканер, его цена и скорость сканирования в час для разворота книжки обычного(самого распространенного) формата?
      >
      > Сейчас основные сканеры:
      > Mustek 12000 SP Plus (SCSI) скорость сканирования А4 (300дпи) примерно 30 сек. С учетом обратного хода - чуть больше разворота в минуту. Тк. медленный обратный ход. Зато недорого.
      > Acer 640S (SCSI) - проход - чуть быстрее, откат быстрый. Гасит лампу.
      >
      > Замечательны (из опробованных планшетников) старые Хьюлеты - 4c например. 15-20 сек сканирование 10 - обратный ход. Гасит лампу при обратном ходе - тоже плюс. Только не достать их теперь.
      >
      > Совершенно глупо использовать дорогие с высокой цветопередачей сканеры. Они перед каждый проходом греют и калибруют лампу.
      > Вывод - чем дешевле (проще) - тем лучше.
      > SCSI - быстрее чем USB. Правда, такой вывод только на основании личного опыта.
      >
      > > У меня Mustek 1200CU (USB). Цена до 70$. Скорость 200 стр. в час (100 разворотов).
      >
      > Быстро. Меняю представление о ЮСБ.
      >
      > > Я сканю и распознаю сразу, чтоб видеть ошибки распознавания и соответствующе корректировать яркость...
      >
      > Корректирую яркость только в начале сканирования и меняю только в случае, если вижу, что качество печати меняется. Распознаю пакетно. По ночам. Правда после выделения блоков - просматриваю. Особенно если стихи. Бывает такое запилит...
      >
      > > Как понимать Thick-as-a-brick "страницы плохо раскрываются"??? Уточни...
      > > Как понимать Thick-as-a-brick "И времени нет"??? --------------;-) Компьютер-то и так занят... (если он один...)


СООБЩЕНИЯ ЗА 27.09.2003
359. Sokolov, N.Novgorod (sokolov_av@pochta.ru) 11:11:38 [ответить]
      > 358. Zmiy.
      > > 356. Sokolov.
      > > > 355. Zmiy.
      > поиск работает в фр5-6-7, но только для "мягкого переноса" и "разрыва строки"...
      > а я ищу как можно найти "конец абзаца"...
      > никто не знает?
      >
      > frf не поизменяешь - в фр5-6-7 после таких изменений не открывается страница... видно там какие-то контрольные суммы...
     
      Насчет контрольных сумм не уверен. Дело в том, что каждый фрейм (абзац) пишется в отдельный блок -- сначала следует текст (в FR5-7 в Unicode, по-моему), за ним -- описание форматирования, привязка и т.д. При копании нарушается, наверное, привязка к изображению. А вот насчет поиска конца абзаца -- при сохранении форматировании пробелами весь текст в файле пишется в один фрейм (по крайней мере, в 4-ом).


358. Zmiy, Минск (zmiy@inbox.ru) 00:19:03 [ответить]
      > 356. Sokolov.
      > > 355. Zmiy.
      >
      > > Вопрос на засыпку :
      > >
      > > Как в ФР найти символ "конец абзаца"???
      > > (не путайте с символом разрыв строки!)
      > А что - в 7-ом уже есть подержка подобных замен? Или имеется в виду копание в самих frf-файлах?
     
      поиск работает в фр5-6-7, но только для "мягкого переноса" и "разрыва строки"...
      а я ищу как можно найти "конец абзаца"...
      никто не знает?
     
      frf не поизменяешь - в фр5-6-7 после таких изменений не открывается страница... видно там какие-то контрольные суммы...


СООБЩЕНИЯ ЗА 26.09.2003
357. Moris, Moscow 23:57:28 [ответить]
      Простите, но вроде как у вас не работает поисковик =( а без него я ваабще ничего найти не могу =(


356. Sokolov, N.Novgorod (sokolov_av@pochtamt.ru) 20:52:13 [ответить]
      > 355. Zmiy.
     
      > Вопрос на засыпку :
      >
      > Как в ФР найти символ "конец абзаца"???
      > (не путайте с символом разрыв строки!)
      А что - в 7-ом уже есть подержка подобных замен? Или имеется в виду копание в самих frf-файлах?


355. Zmiy, Минск (zmiy@inbox.ru) 12:19:59 [ответить]
     
      Вопрос на засыпку :
     
      Как в ФР найти символ "конец абзаца"???
      (не путайте с символом разрыв строки!)


354. Zmiy, Минск (zmiy@inbox.ru) 01:36:14 [ответить]
      Всем! Всем! Всем!
     
      Вот же блин невнимательность!
      Показали мне в ФР7 возможность сохранения текста как было в ФР4 - с форматированием пробелами...
      Опции-Распознование-Тип страницы-Форматированный пробелами текст, но нужно ставить эту опцию перед распознованием... Так, что интересно - эта опция есть и в ФР5 и в ФР6... А я Вам тут мозги пудрю, а Вы не можете указать на решение... --------------;-)
      При таком варианте нет проблем с абзацами, которые остались при сохранении в вордовские форматы... Так что учтите, что если Вы делаете текст только в Ворде и не исправите ошибок выравнивания после ФР5/6/7, то при сохранении Вашего вордовского файла в TXT будет склейка/разделение абзацев!!!
     
      P.S. Ушел писать прогу преобразования сохраненного из ФР текста форматированного пробелами в правильный(!) текст, готовый к вставке в Ворд...


СООБЩЕНИЯ ЗА 24.09.2003
353. Zmiy, Минск (zmiy@inbox.ru) 16:18:06 [ответить]
      И опять о наших бар-ранах (о ФР7):
     
      Может этот ФР7 и распознает лучше на каких-то "внутренних тестах ABBYY" или стал лучше в каких-то применениях на PDFах, но все-таки он хуже ФР5 по сохранению оформления.
      Замечено следующее: если в ФР5 при сохранении в Word обычно используется выравнивание по ширине, то в ФР6/7 разработчики почему-то намудрили (наверное от слова "мудаки") и в тех же местах идет выравнивание влево, что я считаю вообще нонсенсом в DOC. Особенно это заметно на диалогах. Так еще ж в ФР6/7 появилось заполнение пробелами именно из-за того, что нужно же как-то растянуть строку, раз уж выравнивание влево... Два пробела подряд в файлах DOC - это тоже маразм!
      Если в ФР5 на тех местах, где шла склейка абзацев, идет выравнивание влево, то такие склейки легко находятся полуавтоматически, например, в Wordе. То на ФР6/7 эти же склейки не отличишь от нормальных ситуаций...
      У меня написана программа, которая из сохраненного в ФР специальным образом RTF файла, путем анализа этих самых выравниваний, делает текстовый файл с исправлениями склееных/разделенных абзацев. Так вот на ФР5 программа делает потрясающие результаты - в большинстве случаев после нее нет дополнительной правки абзацев. В то время как после ФР6/7 из-за таких заумностей, как выравнивание влево в нормальных абзацах, - делается много доисправлений...
     
      ...и я вернулся на ФР5.
     
      P.S. условный (для V.Yesaulovа): Если какая-то программа некорректно выполняет заявленные функции, то будете ли Вы покупать такую программу?


СООБЩЕНИЯ ЗА 21.09.2003
352. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 03:08:53 [ответить]
      > 351. V.Yesaulov.
      > > 350. Один из....
      > > Защита FR7 вскрыта...
      >
      > Плачет по вам ФБР. Горькими слезами! :)
     
      Фиг с ней, с фыбырой, она за бугром и до нее нам никаких дел нету. Действительные проблемы я вижу в другом. Их две. Первая. Из-за того, что программы и приложения платные, для общества в целом больше убытков, чем прибыли. Вторая. Хороший кряк ФР, в частности, - очень даже большая редкость. А сам по себе кряк как таковой - дело совершенно обычные, которое у сотен тысяч наших соотечественников никаких эмоций и вопросов вообще не вызывает. Поскольку сообщение о том, что крякнут 7-й ФР, я вопринимаю как пустой звук.


СООБЩЕНИЯ ЗА 19.09.2003
351. V.Yesaulov, Moskva (yes@zonus.ru) 13:32:38 [ответить]
      > 350. Один из....
      > Защита FR7 вскрыта...
     
      Плачет по вам ФБР. Горькими слезами! :)


350. Один из..., 13:19:42 [ответить]
      Защита FR7 вскрыта...


СООБЩЕНИЯ ЗА 18.09.2003
349. зТЙЗПТЙК, сТПУМБЧМШ 13:04:27 [ответить]
      > 345. bmn.
      > > и 7-м, а 5-м ФР. Он меньше придумывает. Совершенно согласен с
      > Не согласен. 5-й тоже придумывает преизрядно.
      Там это можно частично отключить, в большей степени, чем в шестом.


СООБЩЕНИЯ ЗА 14.09.2003
348. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 02:16:03 [ответить]
      Есть в сети книги типа ван Спэнкерен, история американской литературы (http://www.russian.rpo.at/pdf/ch1_lit.pdf>http://www.russian.rpo.at/pdf/ch1_lit.pdf), сделанные в pdf. В txt они корректно не конвертятся. Конвертация сама по себе достаточно простая, по принципу: латинская а соответствует русской ф, s - ы и т.д. Проблема в том, что после такой конвертации остается штук 5 русских букв, не имеющих соответствий в латинском наборе. Они обозначаются точками, и остается догадываться, какие это буквы на самом деле. Есть идеи для решения такой закавыки?


347. Артман, Волгоград (artman@mail.ru) 01:24:54 [ответить]
      Меня 5-й очень редко подводил, триал есть с каждым сканером, а если нужен кряк, то пишите - вышлю.


СООБЩЕНИЯ ЗА 13.09.2003
346. Bowline, Москва (bowline@mail.ru) 11:40:02 [ответить]
      > 343. Den.
      > > 340. Zmiy.
      > > > 339. Bowline.
      > > > А кто-нибудь не знает, где Файн ридер этот взять? А то я что-то не найду...
      > >
      > > www . abbyyusa . com в downloadax... Но это бесполезный trial (не качай зазря)...
      >
      > А кряк под этот триал найти невозможно? Через тот же гугль?
     
      А может есть где не-трайал?


345. bmn, (bmn@lib.ru) 10:32:46 [ответить]
      > и 7-м, а 5-м ФР. Он меньше придумывает. Совершенно согласен с
      Не согласен. 5-й тоже придумывает преизрядно.


СООБЩЕНИЯ ЗА 12.09.2003
344. Григорий, Ярославль 15:17:20 [ответить]
      Касательно файнридера. Если речь идет о книгах, с их сложным языков и различными авторскими придумками, распознавать стоит не 6 и 7-м, а 5-м ФР. Он меньше придумывает. Совершенно согласен с textshare, в том, что трудней именно эти придумки отлавливать, которые ворд не считает за ошибки.


СООБЩЕНИЯ ЗА 09.09.2003
343. Den, 19:54:42 [ответить]
      > 340. Zmiy.
      > > 339. Bowline.
      > > А кто-нибудь не знает, где Файн ридер этот взять? А то я что-то не найду...
      >
      > www . abbyyusa . com в downloadax... Но это бесполезный trial (не качай зазря)...
     
      А кряк под этот триал найти невозможно? Через тот же гугль?


342. textshare, 15:33:10 [ответить]
      В пятницу купил лицензионный FineReader 7 Professional.
      У меня грустное впечатление: функциональных изменений я не усмотрел, только перешли от установки с ключевой дискетой на активизацию по сети или телефону с привязкой к железу компа.
     
      Ставишь программу, она выдает номер, который должен зависить от твоего железа. (В руководстве написано, что "небольшой" апгрейд его не изменит, а для нового компа нужна новая активация) Мне по телефону код активации выдали мгновенно. Причем с перерывом в час я FR поставил и на свой ноутбук, и без вопросов получил второй код активации (!). Интересно бы попробовать и в третий раз :-)
     
      Есть предварительное впечатление, что Змей прав, и они снизили уровень проверки и пометки неуверенно распознанных слов и знаков.
      FR, кажется, стал опасно самостоятелен в выборе вариантов: я 3-4 раза ловил его на том, что он при распознании заменил слово и даже его не пометил, как неуверенно распознанное.
     
      Устранен один маленький но неудобный баг (а может и не баг, а так,неосмотр) - изменение инструмента работы с изображением при переходе от страницы к странице. Например, если я прохожусь по всему пакету и чищу изображения от грязи, виньеток или колонтитулов, то каждый раз после переходп к изображению новой страницы приходилось заново выбирать ластик.
     
      Конец короткого абзаца по-прежнему в 20% случаев не определяется и переход к новой строки в конец не вставляется. Были еще какие-то впечатления, но всего не упомню, если интересно - спрашивайте.
     
      Общее впечатление: FR 7 - чисто маркетинговый ход, чтобы еще раз получить деньги с больших корпоративных клиентов за активацию в привязке к железу.


341. п я я я п╟я , п я я п╟п╫п╟ (nurshat@ok.kz) 14:20:48 [ответить]
      п я п╬я я п©п╬п╪п╬я я .
      п я п╬ п╪п╬п╤п╣я п©п╬п╢я п╨п╟п╥п╟я я пЁп╢п╣ п╪п╬п╤п╫п╬ п╫п╟п╧я пё пЁя п╟я пёя п╣я п╨пёп╧ пёп╫я п╣я я п╣п╧я п╢п╩я п п╢п╪пёп╫пёя я я пёя п╬п╡п╟п╫пёпё Informix-я п╟, пё п╨п╟п╨ п╪п╬п╤п╫п╬ п╣пЁп╬ я я я п╟п╫п╬п╡пёя я . п п╬п╤п╣я я п╟п╧я п©п╬п╢я п╨п╟п╤п╣я п╣. п п╩я я я пёп╣ я я п╩п╨пё пЁп╢п╣ п╪п╬п╤п╫п╬ п╠я п╢п╣я п©п╬я пёя п╟я я .
     
      п п╟я п╟п╫п╣п╣ п╠п╩п╟пЁп╬п╢п╟я п╣п╫


СООБЩЕНИЯ ЗА 08.09.2003
340. Zmiy, Минск (zmiy@inbox.ru) 10:09:39 [ответить]
      > 339. Bowline.
      > А кто-нибудь не знает, где Файн ридер этот взять? А то я что-то не найду...
     
      www . abbyyusa . com в downloadax... Но это бесполезный trial (не качай зазря)...


339. Bowline, Москва (bowline@mail.ru) 07:32:03 [ответить]
      А кто-нибудь не знает, где Файн ридер этот взять? А то я что-то не найду...


СООБЩЕНИЯ ЗА 07.09.2003
338. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 01:25:30 [ответить]
      Кста, а как быстро она пдф обрабатывает? (прошу указать притом частоту процессора и размер оперативки). Приблизительно, конечно.


СООБЩЕНИЯ ЗА 05.09.2003
337. Zmiy, Минск (zmiy@inbox.ru) 14:18:12 [ответить]
      > 336. Илья.
      > >> 2) англ.версия не сохраняет результаты на рус.яз. (написано даже в Helpе) - это типа защита... ;)
      >
      > Вот мерзавцы. Редкостные. Головная контора в Москве и нет русского языка в программе! К черту такой файнрыдр.
      > Буду пользоваться 4-м или поиу аналоги.
     
      Ну не надо уж так... ;)
      Нормальная (нетриальная) версия будет работать как нужно!
      А тем более достойных аналогов у ФР нету! Лучше уж в ФР мучаться, чем чем-то похуже... ;)
     
      Я вот продолжил тестирование ФР7.
     
      Взял ну очень плохо отсканированный TIFF (светлый - с недостатком яркости)...
      Распознал в ФР6 и ФР7 и не заметил, чтобы качество распознавания было другим! И там и там одинаковые ошибки! Где в ФР6 не распознавало, там же и ФР7 не распознает...
      Конечно, как я уже говорил ниже :), за счет того что некоторые "неуверенности" теперь не показываются, то да - качество получше... Но по-моему это чисто надуманное улучшение качества. Раньше, к примеру, все без исключения "неуверенности" показывались, а теперь достаточно во внутреннем словаре ФР найти неуверенное слово и сделать вывод, что неуверенности нет - слово же "человеческое" распозналось;). Не говоря уж о том, что в ФР5/6 "неуверенными" были даже пробелы!
      Поэтому те, кто после распознавания сразу сохранял текст и вычитывал в других редакторах, - для тех ничего не улучшится!
      Те же, кто после распознавания, проверял текст в самом ФР, тому конечно улучшение будет заметно! Скорость такой проверки будет повыше...
     
      Забавно другое - в каждой новой версии разработчики уверяют нас, что качество улучшилось на ...дцать процентов... Это если сложить все эти проценты получиться ж ох какая сумма - процентов 100 относительно, например, ФР4. ;) Но такого уж глобального улучшения, по крайней мере, я Н Е В И Ж У !!!
      Какие же это "внутренние тесты компании" проходит ФР, если в реальной работе больших улучшений не заметно...
     
      P.S. Я тут, конечно, не рассматриваю новинки в ФР6/7 типа распознавания PDF... Я тестировал только те функции, которые применяются при сканировании книг!


СООБЩЕНИЯ ЗА 04.09.2003
336. Илья, Таллин 22:03:33 [ответить]
      > > 2) англ.версия не сохраняет результаты на рус.яз. (написано даже в Helpе) - это типа защита... ;)
     
      Вот мерзавцы. Редкостные. Головная контора в Москве и нет русского языка в программе! К черту такой файнрыдр.
      Буду пользоваться 4-м или поиу аналоги.


335. KpucmuHa, Mekcuko (crisarb@yahoo.com) 20:56:35 [ответить]
      Hola


334. Zmiy, Минск (zmiy@inbox.ru) 17:05:11 [ответить]
      > 333. PDF-Library.
      > > 332. Zmiy.
      > > 2) англ.версия не сохраняет результаты на рус.яз. (написано даже в Helpе) - это типа защита... ;)
      >
      > Привет, Змиюга!
      >
      > Это как так понимать??? Я работаю под немецким Windows, где русская версия FR никогда не идет, даже под Win-ХР. Значит ли это, что теперь я не могу либо Win, либо FR-7 использовать?
     
      FR7 - Справка - Справка - Активация -
     
     
      Компания ABBYY принимает меры по борьбе с компьютерным пиратством и защите прав на интеллектуальную собственность. Пиратство причиняет ущерб не только производителям программного обеспечения, но и конечным пользователям. Приобретая лицензионные продукты, пользователи получают программные продукты без каких-либо изменений, сделанных третьими лицами, в то время как пиратские продукты не могут гарантировать этого.
     

     
      . . .
     
     
      В зависимости от версии продукта и территории его распространения, возможны следующие ограничения по функциональности:
     
      Невозможность сохранения и печати распознанного текста на языках с кириллическим алфавитом (ABBYY FineReader 7.0 Professional Edition);
      Невозможность сохранения и печати распознанного текста на всех поддерживаемых языках (ABBYY FineReader 7.0 Professional Edition);
      Версия ABBYY FineReader 7.0 Corporate Edition без активации не работает.
     


333. PDF-Library, Augsburg, Germany (info@imwerden.de) 14:45:29 [ответить]
      > 332. Zmiy.
      > 2) англ.версия не сохраняет результаты на рус.яз. (написано даже в Helpе) - это типа защита... ;)
     
      Привет, Змиюга!
     
      Это как так понимать??? Я работаю под немецким Windows, где русская версия FR никогда не идет, даже под Win-ХР. Значит ли это, что теперь я не могу либо Win, либо FR-7 использовать?


332. Zmiy, Минск (zmiy@inbox.ru) 12:28:02 [ответить]
     
      Информация :
     
      Вышел FineReader 7.0 : http://www.abbyy.ru/press_release.asp?param=28667>http://www.abbyy.ru/press_release.asp?param=28667
     
      Скачал англ.триал, установил, проверил, докладаю :
     
      1) доп.языки скачиваются с интернета
      2) англ.версия не сохраняет результаты на рус.яз. (написано даже в Helpе) - это типа защита... ;)
      3) по распознаванию - объективно не улучшилась, субъективно улучшилась из-за того, что там где ФР5/6 показывал неуверенности типа "неуверенно распознанные символы", то ФР7 уже не показывает...
      Судя по всему "качество" они улучшили как раз за счет того, что не показывают некоторые "неуверенности"...
      Нужно проверить качество на очень плохо отсканированном тексте...
      4) по сохранению оформления - не улучшилось - как ФР5/6 неправильно определял абзацы, так и ФР7 неправильно определяет...
      Я надеялся что в ФР7 они над этим поработают и сделают так как было в ФР4, где оформление правильно воссоздается (по крайней мере разбиение на абзацы), но оказалось, что я размечтался...
     
      Проверка производилась по тем же тестовым TIFFам - http://zpdd.chat.ru/files/test-tif.rar>http://zpdd.chat.ru/files/test-tif.rar
      Сравнение оформления у ФР4/5/6 - http://zpdd.chat.ru/files/test-txt.rar>http://zpdd.chat.ru/files/test-txt.rar
     
      Вывод : Можно переходить на ФР7 !
     
      P.S. Кто-нибудь - также протестируйте ФР7 и скажите результаты ваших тестов...


СООБЩЕНИЯ ЗА 03.09.2003
331. Павел, Самара (afpavel@yandex.ru) 22:05:17 [ответить]
      Мужики, возникла проблема! Помоги кто может!
      Установил Fine Reader 6, несколько месяцев работало всё нормально, но потом почему то, полетела функция сохранения результатов сканирования, при попытке сохранить отсканированный текст в Worde или в буфере обмена программа выдает внутреннюю програмную ошибку и пишет: D:\Fine Reader6\.\FineObjects\Inc\Errors.h, 150. Такого адреса не существует, программа и дистрибутив находятся на диске C:\. Пробовал переустанавливать,чистил реестр, удалял всё связанное с OCR, вновь переустанавливал - ничего не помогает. Может кто-нибудь знает в чём дело, буду очень признателен.


330. Zmiy, Минск (zmiy@inbox.ru) 09:58:40 [ответить]
      Вопрос:
      Отзовитесь у кого сканер Umax Astra 4700 ???
      В частности интересует версия драйвера и ПЗУ (I/O) (смотреть в twainе - справа вверху кнопочка есть - информация).
      А то что-то меня мой смущает - разные драйвера по-разному себя ведут...


СООБЩЕНИЯ ЗА 02.09.2003
329. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 02:48:55 [ответить]
      обновлений. Считай, что это попытка усовершенствования файл-эхи FIDO, самым главным недостатком которой является ущербность сопровождения произведения и поддержка морально устаревших TXT-файлов.
     
      Идея эхоконференции фидо fileecho на самом деле существенно другая. Проще всего, если знаешь имя нужного файла. Искалка на клиенте по твоему запросу пробежит по бибиэскам и пришлет справку о том, где искомое есть. Она может также бегать и по file_id.diz-файлам, т.е. присылать справки по введенным в них описаниям. Но тут особенная "точность" нужна. Если это какая-нибудь программа, то ошибиться очень тяжело. А если описание книги, где может быть автором Хоторн или Готорн, Донливи или Данливи? Часто пишется двояко, кроме того, библиотекари часто элементарно вопиюще неграмотны, даже и не знают того, что на самом деле в их библиотеках есть. Встречаются даже описания типа "Про войну без автора", или догадайся, мол сама... :-(


СООБЩЕНИЯ ЗА 01.09.2003
328. andy, НПУЛЧБ (andy@zhilcredit.ru) 17:29:44 [ответить]
      > Спасибо


327. Andrej, Ekaterinburg (tverjakov@mail.ru) 17:04:25 [ответить]
      > 326. andy.
      > кто-нибудь знает что случилось с Фензином (www.fenzin.org)?
     
      Snake пообещал, что откроются 11-12 сентября:
     
      http://www.bomanuar.ru/forum/viewtopic.php?p=2100&sid=b3edf35343fe8e153bf80256c7400fb2>http://www.bomanuar.ru/forum/viewtopic.php?p=2100&sid=b3edf35343fe8e153bf80256c7400fb2


326. andy, москва (andy@zhilcredit.ru) 16:29:01 [ответить]
      кто-нибудь знает что случилось с Фензином (www.fenzin.org)?


325. Sokolov, N.Novgorod 08:14:38 [ответить]
      > 323. Вячеслав Сачков.
      > > 322. Sokolov.
      > И Вас я, к сожалению, обломать вынужден. Это только иллюзия такая ламерская, что сетевые библиотеки существуют долго. На самом деле большинство их живет всего по паре лет и даже меньше. Для меня нет большего огорчения, когда какая-нибудь прелестная библиотека, например, "Словесник" или "Симпад", пропадает. И происходит это гораздо чаще, чем мне хотелось бы предполагать. Что успел скачать, когда они были, то у меня отложилось. А что не успел, то пропало совсем навсегда. Поэтому предлагаемое Вами сочленение вживую не выручит. Я это знаю наверняка. Выручить могут огромные офлайновые коллекции, как, например, у меня и у тезки моего Алексеева, однако офлайн есть офлайн... :-(
     
      А это как раз и предлагается для решения подобных проблем. Некий клиент будет предназначен для автоматического обновления в основном мощных оффлайновых коллекций, их которых-то и составляются сетевые библиотеки. По сути дела предлагается в десятки раз увеличить их количество, создать систему их согласованного обновления. Пускай может исчезнуть проект, в едином пространстве библиотек файл останется навсегда, даже за очень короткое время он успеет разойтись по десяткам и сотням библиотек, вот только времени на доступ к нему необходимо больше. В этом случае необходимо настроить только систему выборки из общего потока, загрузка будет идти самим клиентом. Создание/реставрация новых сетевых библиотек на базе выборки из единого каталога будет происходить очень быстро. Один владелец действительно не сможет выполнить это быстро, а если монтаж будет идти из нескольких десятков центров (причем без непосредственного участия владельцев, cgi-скриптами)? Клиент центрального каталога будет опрашивать сначала online-, а при временном отсутствии в их базах произведений, и offline-библиотеки при их временной регистрации для получения обновлений. Считай, что это попытка усовершенствования файл-эхи FIDO, самым главным недостатком которой является ущербность сопровождения произведения и поддержка морально устаревших TXT-файлов.


324. Andrej, Ekaterinburg (tverjakov@mail.ru) 03:05:53 [ответить]
     
      Кое-что из исчезнувших библиотек (в частности того же www.slovesnik.ru) можно найти в архиве www.archive.org (правда, только html, но не запакованные файлы, к сожалению).
     
      Поэтому, большая просьба ко всем, кто у себя на сайтах ставит ссылки на другие ресурсы: не убирайте ни в коем случае недействительные ссылки, просто помечайте их как устаревшие!
     
      Даже если сайта уже нет, или материал с него убран - это еще не значит, что он безвозвратно пропал. Зная бывший адрес его часто еще можно выцарапать из кеша Гугля или Апорта, а также из вышеназванного веб-архива!


323. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 00:11:44 [ответить]
      > 322. Sokolov.
      > В свете только что прочитанных сообщений актуальным выглядит вопрос создания единого каталога электронных библиотек, в котором должны регистрироваться все отсканированные любителями-OCR-щиками произведения. Система должна состоять из трех уровней: единый каталог, бесплатные online- и offline- (с периодическим подключением) электронные библиотеки (к ним относятся и OCR-щики) и собственно читатели. В этом случае
     
      И Вас я, к сожалению, обломать вынужден. Это только иллюзия такая ламерская, что сетевые библиотеки существуют долго. На самом деле большинство их живет всего по паре лет и даже меньше. Для меня нет большего огорчения, когда какая-нибудь прелестная библиотека, например, "Словесник" или "Симпад", пропадает. И происходит это гораздо чаще, чем мне хотелось бы предполагать. Что успел скачать, когда они были, то у меня отложилось. А что не успел, то пропало совсем навсегда. Поэтому предлагаемое Вами сочленение вживую не выручит. Я это знаю наверняка. Выручить могут огромные офлайновые коллекции, как, например, у меня и у тезки моего Алексеева, однако офлайн есть офлайн... :-(


СООБЩЕНИЯ ЗА 31.08.2003
322. Sokolov, N.Novgorod 20:21:18 [ответить]
      В свете только что прочитанных сообщений актуальным выглядит вопрос создания единого каталога электронных библиотек, в котором должны регистрироваться все отсканированные любителями-OCR-щиками произведения. Система должна состоять из трех уровней: единый каталог, бесплатные online- и offline- (с периодическим подключением) электронные библиотеки (к ним относятся и OCR-щики) и собственно читатели. В этом случае запрошенное читателем из единого каталога произведение может быть им получено, пока существует набор библиотек с разрешенной владельцами бесплатной отправкой книг.
      Фактически любая, даже самая раскрученная библиотека, должна стать одной из множества ей подобных...
      Единый каталог может также решить проблему согласованного обновления фондов (исправления плохо вычитанных произведений). Также он может позволить решить спорные вопросы с принципами подготовки произведений к размещению в сети (предполагается, что будут регистрироваться все форматы: TXT, RTF, DOC, PDF, HTML и пр. и пр.).
      В дальнейшем обязателен переход на одноуровневую систему (аналог пиринговой сети).


321. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 05:48:15 [ответить]
      > Да нет там никаких фактов. Журналистский треп про ужасных хакеров-пиратов. Безмозглая статья. Не обращайте внимания. Даже если и будут платные библиотеки, ими почти никто не будет пользоваться. Очевидно, что будет альтернатива. Разные современные письменники будут пытаться "заработать в Сети". На здоровье, я их не читаю. "Авторское право" имеет срок в "50 лет после смерти автора". То есть "классика" здесь не при чем, нет никаких юридических обоснования для запрещения выкладывания старой литературы. Дж.Конрад которого я (злодей, пират и варвар) сейчас сканирую (то есть происходит "грабеж среди бела дня")умер в 1924-м году, никакое авторское право на его книги уже не распространяется.
     
      Да нет. Все именно так и будет, как утверждается, а не так, как Вы считаете. Объясню, почему. Колоссальное большинство пользователей сети - даже не ламеры, а, я извиняюсь, тупые бараны, совершенно не умеющие ничего находить и совершенно не представляющие того, как это делать. Причем доля баранов в общем числе пользователей сильно увеличивается буквально с каждым днем. Соответственно увеличивается и число вебмастеров, желающих заработать на этом деньги. Так, еще год назад виртуальных книжных магазинов было раз-два и обчелся. Сейчас их количество увеличилось минимум на порядок. Далее. Год назад уже имелись платные электронные библиотеки, но они существовали в качестве курьезных раритетов, затей глупых чудаков. Сейчас и такого добра стало значительно больше. На выходе получаем следующую картину. Чайник тупой хочет, например, "Die Leiden des jungen Werthers" на русском языке найти. Тычет в яндекс и на первых десяти страницах ответа получает ссылки на сайты книжных магазинов, на следующей паре страниц - ссылки на платные виртуальные книгохранилища. И где-то на 14-й странице приблизительно он найдет ссылки на бесплатные файлы. Причем в большинстве своем это будут ссылки дохлые или криво прописанные, неоткрывающиеся. А из тех версий сканинга (допустим, трех-четырех), которые товарищ найдет и бесплатно скачает, большинство будет не вычитано совсем или вычитано, извиняюсь, через задницу. Или еще в формате какого-нибудь экзотического ридера, скачивать и устанавливать который надо три дня и еще пять дней на то терять, чтобы с ним освоиться. Нет, чайник тупой таких гигантских усилий затрачивать не станет. Ему же ведь еще надо объяснить, что книги из сети в подавляющем большинстве своем бесплатно качаются. А большинство баранов безмозглых этой великой премудрости просто вообще не знает. Скачает за деньги по первой попавшейся ссылке и все, будет счастливо... :-(


320. Ilja, 00:46:02 [ответить]
      См. http://www.livejournal.com/users/utkasmerti/>http://www.livejournal.com/users/utkasmerti/ , частично там есть и "ответы".
     
      > Книги не могут быть "freeware", copyleft по определению - первое относится только к программному обеспечению и призвано снять с производителя всякую ответственность за неправильную роботу программы, а второе может быть использовано только самим автором.>
      Это совершенно очевидно. Я имею ввиду идеологию свободного использования (где фривэр и копилефт только частные примеры). О чем уже было много написано, в частности здесь: http://www.hot.ee/utkasmerti/more/declaration.htm>http://www.hot.ee/utkasmerti/more/declaration.htm , и здесь
      http://imperium.lenin.ru/LENIN/32/C/>http://imperium.lenin.ru/LENIN/32/C/
     
      > Вам сам Толстой сказал, что его книги можно распространять как copyleft?>
      Чудесный аргумент, что и говорить. Если такие аргументы(некорректные, я хочу сказать), то мой ответ: Да, сам сказал!
      Кстати, если уж о Толстом, то он от прав на свои произведения отказывался, это общеизвестно.
     
      > >Так вот там предлагают платный доступ к "Поэтическому сборнику" Гумилева, "Страданиям молодого Вертера" Гете, К произведениям Байрона, Пастернака, Шекспира.>>
     
      Что взять с платных мерзавцев? Плюньте и забудьте. Дураки люди.
     
      > О качестве статьи: мне важны изложенные в ней факты.>
      Да нет там никаких фактов. Журналистский треп про ужасных хакеров-пиратов. Безмозглая статья. Не обращайте внимания. Даже если и будут платные библиотеки, ими почти никто не будет пользоваться. Очевидно, что будет альтернатива. Разные современные письменники будут пытаться "заработать в Сети". На здоровье, я их не читаю. "Авторское право" имеет срок в "50 лет после смерти автора". То есть "классика" здесь не при чем, нет никаких юридических обоснования для запрещения выкладывания старой литературы. Дж.Конрад которого я (злодей, пират и варвар) сейчас сканирую (то есть происходит "грабеж среди бела дня")умер в 1924-м году, никакое авторское право на его книги уже не распространяется.
      Еще раз говорю, статья дурацкая (штампы, мифы, недодуманный фарш), трепло, обращать на нее внимания не имеет смысла. За ссылку спасибо.


СООБЩЕНИЯ ЗА 30.08.2003
319. Халява кончилась!!!, 18:43:08 [ответить]
      > 317. Илья Васильев.
      > 1. Само слово "халява" довольно-таки отвратительно. Так что прекрасно, если эта гадость на самом деле умрёт. Есть "freeware", copyleft, свободное пользование и т.д. А есть "халява". Прошу такие вещи не путать.
     
      Чем вам не понравилось слово "халява"?
      Книги не могут быть "freeware", copyleft по определению - первое относится только к программному обеспечению и призвано снять с производителя всякую ответственность за неправильную роботу программы, а второе может быть использовано только самим автором. Вам сам Толстой сказал, что его книги можно распространять как copyleft?
      Само слово "халява" как раз и подразумевает свободное пользование. Звучит мерзко, согласен, но и что с того?
     
      > 2. Вы должно быть хотели сказать, что больше нельзя будет пользоваться библиотекой Мошкова бесплатно? Это не так, перечитайте статью еще раз. Речь идет о другом, а именно о том, что ряд современных издательств и авторов будут открывать (а ля Стивен Кинг) сайты, где можно будет прочесть книги за деньги.
     
      Прочитайте внимательно отрывок из статьи на форуме. Там сказано "В самое ближайшее время там (то есть на либ.ру) будет запущена коммерческая библиотека, за скачивание книги придется платить."
      Относительно авторов: это уже не новость. Новость - это создание универсальных библиотек по типу библиотеки Мошкова, только платных.
     
      > Что библиотеки Мошкова "не отменяет" вообще-то. Какие еще деньги за Илиаду, Шекспира, Толстого, вы сами подумайте? Никакое "авторское право" в отношении "старых" авторов (вплоть до середины 20-го века) вообще уже не существует.
     
      Хочу обратить ваше внимание на ресурс www.vip.km.ru. Его уже ругали на этом форуме, но я не об этом. Так вот там предлагают платный доступ к "Поэтическому сборнику" Гумилева, "Страданиям молодого Вертера" Гете, К произведениям Байрона, Пастернака, Шекспира... Это ли не классика?
     
      > Глупые и наивные издатели просто надеются, что круутой рассиский детектив, пелевин-сорокин и лукьяненко будут покупаться и в Сети. То есть по большей части разный скоропортящийся товар.
      > Вы бы стали платить? Я не стал бы, лучше книгу купить.
     
      Не стал бы. Но я еще раз говорю меня мало интересует что там один отдельно взятый автор напишет. Меня интересует, что будет с библиотекой Мошкова?
     
      О качестве статьи: мне важны изложенные в ней факты. Я не филолог, чтобы осуждать стили, тональности и т.п.


318. aLex, 16:44:03 [ответить]
      Маленькая цитата из статьи: "Особо пострадавший от Интернета фантаст Сергей Лукьяненко сказал "Итогам":..." Это Лукьяненко-то, сделавший себе имя на прочтенном всем интернетом файле "Лабиринт отражений" - самый пострадавший?
      И так - каждый абзац. Смесь изрядной некомпетентности в теме одного журналиста со вбитой намертво в голову политкорректностью другого.
     
      В свете вышесказанного - относиться к словам, касающимся Мошкова, всерьез - явно преждевременно. Думаю, Максим не замедлит сообщить пропорцию истины и бреда в цитированном абзаце...


Continue