Список форумов
|
Добавить сообщение
|
Правила
| 26.11.2024, вторник, 23:16:10
Ответ на сообщение в форуме
"Проблемы OCR и электронных библиотек"
:
Обязательно заполните поле:
Ваше имя
Обязательно заполните поле:
Текст сообщения
Ваше имя:
Город:
Е-Маil:
Сайт:
> [132. Zmiy]. > Привет All! > > Не будет ли любезен многоуважаемый All раскрыть тайну "Золотого ключика"? > > Абзацем считается несколько предложений не разделенных переводом строки. Это видно в ФР или в Ворде, если включить отображение непечатаемых символов. Если есть перевод строки - это новый абзац. > > Замечено, что ФР5/6 неверно распознают абзацы. Т.е. происходит либо склейка либо разделение абзацев. Самый простой пример - стихи - нет переводов строк... Другой пример - если абзац состоит из одного предложения, которое влезает в одну строку, т.е. заканчивается примерно на правой границе, то этот абзац непременно склеится со следующим. Есть еще другие варианты... > > Для экспериментов скачайте тестовые TIFFы, на которых проявляются такие ошибки: >
http://zpdd.chat.ru/files/test-tif.rar
> > Результаты моих исследований можно посмотреть тут: >
http://zpdd.chat.ru/files/test-txt.rar
> > Пояснения: 4-5-6 - ФР4-ФР5-ФР6 > > *.tx1 - сохранение из ФР в ТХТ с делением на строки > > *.tx2 - сохранение из ФР в ТХТ без деления на строки, вот только test4.tx2 получен из test4.tx1 (на переносы не смотреть). > > В test5.tx2 и test6.tx2 видно если смотреть по картинкам, где идет склейка абзацев! > > *.tx3 - сохранение из ФР5/6 в *.rtf плюс пропуск через спец-программу. Видно, что абзацы, которые склеились в *.tx2 исправлены, но есть ложные срабатывания алгоритма - ложные абзацы... > > > Так вот, наконец, вопрос: > Как All борется с такой ситуацией? > Какова методика исправления абзацев? (кроме как вычитки) > > ФР4 не предлагать! > Это слишком просто (очень примитивно в век ФР5/6 и космических полетов). > Я знаю, что в ФР4 есть сохранение в TXT > с сохранением форматирования при помощи пробелов. И видел, что там с абзацами таких проблем нету... > > С уважением, Zmiy. --------------:-) >
http://zmiy.da.ru
Сортировать форумы по возрастанию даты публикации?
(Использовать эту опцию не рекомендуется)