Список форумов
|
Добавить сообщение
|
Правила
| 26.11.2024, вторник, 17:27:51
Ответ на сообщение в форуме
"Проблемы OCR и электронных библиотек"
:
Обязательно заполните поле:
Текст сообщения
Обязательно заполните поле:
Ваше имя
Ваше имя:
Город:
Е-Маil:
Сайт:
> [296. Zmiy]. > Вот-вот... Давайте от большого ума наплодим электронных текстов в экзотических форматах... > Километровые HTML... PDF... LIT... Что дальше?.. > А потом все вместе будем объяснять как перевести это в нормальные (ЧЕЛОВЕЧЕСКИЕ) форматы... > > Преобразование PDF в DOC/TXT : > 1) в AcrobatReader выделить текст и скопировать в буфер обмена, потом текст вставить в любой текстовый редактор > 2) использовать программы конвертирования PDF в другие форматы > 3) использовать FineReader 6. Он позволяет открывать PDF и через распознование сохранять в другие форматы > 4) через полный Acrobat PDF сохранить в набор TIFов, открыть их через тот же FineReader, распознать, сохранить... > > Лучший вариант - (4) - только так можно получить приемлемый (качественный) результат. Другие варианты не позволят скопировать текст, если PDF сделан в виде картинок, а также не позволят открыть некорректные PDFы... Еще могут быть проблемы с русским текстом в PDF...
Сортировать форумы по возрастанию даты публикации?
(Использовать эту опцию не рекомендуется)