Список форумов
|
Добавить сообщение
|
Правила
| 26.11.2024, вторник, 19:36:09
Ответ на сообщение в форуме
"Проблемы OCR и электронных библиотек"
:
Обязательно заполните поле:
Ваше имя
Обязательно заполните поле:
Текст сообщения
Ваше имя:
Город:
Е-Маil:
Сайт:
> [235. Gen]. > > [234. PDF-Library]. > > > [233. Gen]. > > > Привет, > > > > > > Подскажите программку/утилитку/скрипт чтоб убрать "жесткие" переводы строк из книг скачанных из lib.ru? > > > > > > Thanks, > > > Gen > > > > Я уже научился это делать в Word с помощью "Найти-Заменить". >Сначала меняешь все концы строк (^p) на пробел. Затем шесть >пробелов на один конец строки, чтобы вернуть истинные абзацы. >Затем два пробела на один до тех пор, пока не скажут "0". >Затем меняешь кавычки "" на принятые в российской >типографии ╚╩. Затем текст прочитывается-вычитывается на >предмет: сносок, переводов иноязычных текстов, самих >иноязычных текстов, которые, будь они на французском, немецком >и многих-многих других языках имеют в любимом формате "txt" >кучу ошибок. Проверяются опечатки, текст сверяется с книгой >там, где написание вызывает сомнение. После этого книгу можно >читать... > > Нашел вот на Мухоморе ссылку на утилиту `convert` которая делает все что нужно. > > Но... по прежднему есть проблемы. Проблемы с кодировкой при использовании микрософтовского плагина для ворда. Если же я использую ReaderWorks, то для 2/3 книг он ругается на незакрытый тег в html.. :( > > Thanks, > Gen
Сортировать форумы по возрастанию даты публикации?
(Использовать эту опцию не рекомендуется)