Список форумов |  Добавить сообщение |  Правила |  26.11.2024, вторник, 09:50:24
СПИСОК ФОРУМОВ
26.11.2024
09:45 Главная гостевая книга библиотеки(3658)
24.11.2024
16:42 "Разыскиваются книжки", доска объявлений(15475)
20.11.2024
11:47 Обо всем - мнения(3131)
07:16 Русские впечатления о заграничной жизни(9431)
01.10.2024
13:10 Проблемы OCR и электронных библиотек(1967)
09.09.2024
04:35 Книжки, которые скоро будут выложены(47)
06.05.2024
02:06 О возвышенной поэзии(1568)
02.02.2024
15:33 Книжки, которые стоит прочитать(5187)
12.11.2023
00:25 Мнения читателей о дизайне библиотеки(1478)
Lib.Ru

Проблемы OCR и электронных библиотек
Тема форума: В этом форуме обсуждаются общие проблемы связанные с поддержкой электронных библиотек и сканированием книг.

А так же обсуждение статьи Вадима Ершова "О коллективных сайтах"

Отсортировано по [убыванию] [возрастанию]   

СООБЩЕНИЯ ЗА 17.12.2003
482. Лягушонок, 13:48:04 [ответить]
      > Zmiy, я скачал твою программу , а она не запускается и инфа на тарабарском языке. кодировку подобрать не смог.
      что делать???
      > > 464. Лягушонок.
      > > Люди, кто нибудь знает как убирать лишние знаки перевода на другкю сторчку. Потому что текст выровнян и растянуть его по странице нет никакой возможности, кроме как убирать эти значки в ручную, а это очень долго и тело все затекает...
      >
      > Чтобы убрать лишние переводы строк, в тексте должны быть как-то выделены абзацы (например, несколькими пробелами), иначе весь текст получится одним абзацем...
      > Использовать можно, например, программку PREWORD.COM из набора утилит от LLEO - http://lleo.aha.ru/soft/micrsoft.htm>http://lleo.aha.ru/soft/micrsoft.htm . Скачайте там архив и почитайте !README - там много полезных программ обработки текста...
      > А можно взять мою утилитку CLTXT.EXE - http://zmiy.by.ru/>http://zmiy.by.ru/ . Она, кроме удаления лишних переводов строк, еще и убирает переносы слов...
      > Если же текст в формате DOC, то можно либо сохранить в формат TXT, обработать текст предложенными утилитками, а потом загрузить текст в Word и отформатировать красиво, либо использовать возможности самого Wordа - поиск и замена, нажать кнопочку "Больше" и там выбрать "Специальные символы". Кроме того существуют дополнительные макросы для Wordа, которые тоже очень полезны - например, макрокоманда "Конвертор текста MS-DOS" в наборе макросов "Верстка книжкой" - http://www.newtech.ru/~orlov/verstka.htm>http://www.newtech.ru/~orlov/verstka.htm .


481. Бюдзу, Уижябю 10:55:15 [ответить]
      > 479. IVY.
      > Огромное спасибо за Вашу библиотеку!
      > все равно ширина текста не меняется. Может не одна я имею такую проблему?
     
     
      Не одна. Недавно орали на эту тему. Значит, выделяете в браузере текст и через клипборд перекидываете в Блокнот. Из блокнота - через клипборд - в Word. В Word'е говорите: "Формат - Автоформатирование". Прежде чем ОКнуть, найдите в окне запроса кнопку "Параметры", там - птицу "Сохранять стили", и снимите её.
      Выделите весь текст и установите параметры страницы по вкусу Вашего принтера. В меню "Формат - Колонки" сделайте 4 колонки и 4 мм между ними. В меню "Формат - Абзац" сдвиньте строки (настраивается опытным путём). В меню "Формат - Шрифт" соберите в кучу буквы (правда, плотнее стандарта тяжело читается). Ещё есть шрифт, экономящий тонер и бумагу, но об этом - отдельно.


СООБЩЕНИЯ ЗА 16.12.2003
479. IVY, Mt.Laurel, NJ 21:29:43 [ответить]
      Огромное спасибо за Вашу библиотеку! Ето мой основной доступ к литературе на русском языке!
      Пользуюсь библиотекой втечение нескольких лет. Сбрасываю на принтер и читаю по ночам - не могу по-другому. Только одна проблема, часто текст отформатирован так, что в независимости от того, какие margings выставляю на ширину страницы текста, на текст ето совершенно не влияет. В итоге массу бумаги просто перевожу за счет очень широких полей. Чем ето вызвано? И есть ли возможность форматировать етот теxт так, что бы ето соответствовало например: top 0.3, bottom 0.3,left 0.8, right 0.5. А то получается, что все равно ширина текста не меняется. Может не одна я имею такую проблему?
      Спасибо.


478. Zmiy, Минск (zmiy@inbox.ru) 16:54:53 [ответить]
      > 477. аЧДГС.
      >
      > Спасибо всем откликнувшимся, но всякие скобки не уходят.
      > Скорее, это похоже на хтмля-разметку.
      > Да и расширения tar нету.
      > Такие файлы везде у Мошкова, например - http://lib.ru/PROZA/GALEGO/black.txt_Contents>http://lib.ru/PROZA/GALEGO/black.txt_Contents . Внизу этой страницы нажать флажок, выбрать gZip и нажать кнопку Go.
     
      А, ну файл текстовый Вы вроде из архива gzip все таки достаете...
      Вы имеете в виду вот такие значки - ╤ ╖ ? Так это разметка выравниваний. Ее ручками можно убрать в каком-нибудь редакторе, где есть поиск и замена...
      Попробуйте так - достаньте текст из архива gzip, потом вначале текста поставьте знак меньше, потом HTML, потом знак больше, потом опять знак меньше, потом PRE, и еще раз знак больше (набирайте это без пробелов :) и переименуйте файл, чтобы расширение было htm. Всё - нажмите на файле ввод - текст откроется в Internet Explorere - там html тэги не будут видны... Только квадратики от разметки... Но читать можно...


477. аЧДГС, сХФЪАЧ 12:49:23 [ответить]
      > 476. Zmiy.
      > > 474. бЮДТГ.
      > > Подскажите, что делать с форматом gzip (*.gz)? Текст я вижу Windows Commander'ом или WinRAR'ом, но мешают какие-то скобки (<>) и др.
      >
      > Дорогой бЮДТГ из гЪОЖБЮ... ;)
      >
      > gzip - один из архивных форматов из Linux. С ним связан обычно еще и tar (файлы имеют обычно двойное расширение - filename.tar.gz). Оба эти формата прекрасно понимает WinRAR.
      > Зайдите в WinRAR, станьте курсором на архив gzip/tar, нажмите Enter - войдете в архив как в каталог, либо нажмите кнопку "Извлечь в"...
     
     
      Спасибо всем откликнувшимся, но всякие скобки не уходят.
      Скорее, это похоже на хтмля-разметку.
      Да и расширения tar нету.
      Такие файлы везде у Мошкова, например - http://lib.ru/PROZA/GALEGO/black.txt_Contents>http://lib.ru/PROZA/GALEGO/black.txt_Contents . Внизу этой страницы нажать флажок, выбрать gZip и нажать кнопку Go.


СООБЩЕНИЯ ЗА 15.12.2003
476. Zmiy, Минск (zmiy@inbox.ru) 14:04:15 [ответить]
      > 474. бЮДТГ.
      > Подскажите, что делать с форматом gzip (*.gz)? Текст я вижу Windows Commander'ом или WinRAR'ом, но мешают какие-то скобки (<>) и др.
     
      Дорогой бЮДТГ из гЪОЖБЮ... ;)
     
      gzip - один из архивных форматов из Linux. С ним связан обычно еще и tar (файлы имеют обычно двойное расширение - filename.tar.gz). Оба эти формата прекрасно понимает WinRAR.
      Зайдите в WinRAR, станьте курсором на архив gzip/tar, нажмите Enter - войдете в архив как в каталог, либо нажмите кнопку "Извлечь в"...


475. Bowline, нПУЛЧБ (bowline@mail.ru) 12:42:41 [ответить]
      > 474. бЮДТГ.
      > Подскажите, что делать с форматом gzip (*.gz)? Текст я вижу Windows Commander'ом или WinRAR'ом, но мешают какие-то скобки (<>) и др.
     
      Попробуй WinZip или Dos, правда, не знаю как.


СООБЩЕНИЯ ЗА 09.12.2003
474. бЮДТГ, гЪОЖБЮ (chrt-hum@mtu-net.ru) 10:45:07 [ответить]
      Подскажите, что делать с форматом gzip (*.gz)? Текст я вижу Windows Commander'ом или WinRAR'ом, но мешают какие-то скобки (<>) и др.


СООБЩЕНИЯ ЗА 06.12.2003
473. Света, 13:27:36 [ответить]
      Нет-нет, это "нормальный" автор :)
      Просто я с ним связывалась по почте, чтобы узнать, согласен ли он на публикацию.


472. Максим Мошков, 13:23:35 [ответить]
      > 471. уЧЕФБ.
      > - автору пообещала...
     
     
      Кстати - welcome http://zhurnal.lib.ru>http://zhurnal.lib.ru - автоматизированое размещение авторских работ.


471. уЧЕФБ, 13:09:22 [ответить]
      > Ворд тоже сойдет.
      Мне просто хотелось побыстрее увидеть текст на сайте - автору пообещала...
      Впрочем, я сейчас почитала инструкции на сайте Вадима Ершова, глубоко осознала свою кибернетическую неполноценность и решила-таки отослать ворд... :(


470. Максим Мошков, 12:17:36 [ответить]
      > 469. Света.
      > Уважаемые все,
      > подскажите тупой ламерше, как из doc'а сделать файл, подходящий под категорию "Приветствуются и обрабатываются в первую очередь" - так, чтобы в тексте сохранился курсив и двухуровневая система заголовков?
     
      Ворд тоже сойдет.


469. Света, 08:34:13 [ответить]
      Уважаемые все,
      подскажите тупой ламерше, как из doc'а сделать файл, подходящий под категорию "Приветствуются и обрабатываются в первую очередь" - так, чтобы в тексте сохранился курсив и двухуровневая система заголовков?


СООБЩЕНИЯ ЗА 05.12.2003
468. ЯVR, 16:03:51 [ответить]
      > 463. Zmiy.
      > > 462. ЯVR.
      > > А какой прогой удобней всего вычитывать/редактировать текст в .txt ?
      >
      > Я вычитываю в FARе...
      > А так все обычно используют MS Word, т.к. в нем есть широкие возможности по редактированию, форматированию, поиску-замене и проверке орфографии...
     
      Как ни странно я тоже использую Ворд :) но вот увидел всякие красивые проги-читалки и подумал, что для вычитки/редактирования тоже есть что-то красивое ;) (фон, сглаживание и т.п.)


467. Alla, 14:09:27 [ответить]
      > [464. п А я так это просто в Word делаю, без всяких прибамбасов, через Autoformat. Только там надо Preserve styles отключить.


466. Zmiy, Минск (zmiy@inbox.ru) 14:00:44 [ответить]
      > 464. Лягушонок.
      > Люди, кто нибудь знает как убирать лишние знаки перевода на другкю сторчку. Потому что текст выровнян и растянуть его по странице нет никакой возможности, кроме как убирать эти значки в ручную, а это очень долго и тело все затекает...
     
      Чтобы убрать лишние переводы строк, в тексте должны быть как-то выделены абзацы (например, несколькими пробелами), иначе весь текст получится одним абзацем...
      Использовать можно, например, программку PREWORD.COM из набора утилит от LLEO - http://lleo.aha.ru/soft/micrsoft.htm>http://lleo.aha.ru/soft/micrsoft.htm . Скачайте там архив и почитайте !README - там много полезных программ обработки текста...
      А можно взять мою утилитку CLTXT.EXE - http://zmiy.by.ru/>http://zmiy.by.ru/ . Она, кроме удаления лишних переводов строк, еще и убирает переносы слов...
      Если же текст в формате DOC, то можно либо сохранить в формат TXT, обработать текст предложенными утилитками, а потом загрузить текст в Word и отформатировать красиво, либо использовать возможности самого Wordа - поиск и замена, нажать кнопочку "Больше" и там выбрать "Специальные символы". Кроме того существуют дополнительные макросы для Wordа, которые тоже очень полезны - например, макрокоманда "Конвертор текста MS-DOS" в наборе макросов "Верстка книжкой" - http://www.newtech.ru/~orlov/verstka.htm>http://www.newtech.ru/~orlov/verstka.htm .


465. юВДПЖ, жГМТЮВ (chrt-hum@mtu-net.ru) 13:53:43 [ответить]
      > 464. Лягушонок.
      > Люди, кто нибудь знает как убирать лишние знаки перевода на другкю сторчку. Потому что текст выровнян и растянуть его по странице нет никакой возможности, кроме как убирать эти значки в ручную, а это очень долго и тело все затекает...
     
      Запускаешь Ultraedit и меняешь сочетание кодов 0D0A (перевод) на 20 (пробел). Могу также выслать курочилку word'овских файлов на эту тему.


464. Лягушонок, САранск (badoka@list.ru) 10:36:02 [ответить]
      Люди, кто нибудь знает как убирать лишние знаки перевода на другкю сторчку. Потому что текст выровнян и растянуть его по странице нет никакой возможности, кроме как убирать эти значки в ручную, а это очень долго и тело все затекает...


463. Zmiy, Минск (zmiy@inbox.ru) 10:10:39 [ответить]
      > 462. ЯVR.
      > А какой прогой удобней всего вычитывать/редактировать текст в .txt ?
     
      Я вычитываю в FARе...
      А так все обычно используют MS Word, т.к. в нем есть широкие возможности по редактированию, форматированию, поиску-замене и проверке орфографии...


СООБЩЕНИЯ ЗА 04.12.2003
462. ЯVR, 22:01:56 [ответить]
      А какой прогой удобней всего вычитывать/редактировать текст в .txt ?


СООБЩЕНИЯ ЗА 25.11.2003
461. Den, 18:30:29 [ответить]
      GreyLib в очередной раз прикрыли за нарушение авторских прав. Но там вебмастер упорный, поэтому есть надежда что сайт восстановится. Пока что попробуйте http://greylib.by.ru/libchild.htm>http://greylib.by.ru/libchild.htm - это старая версия сайта, там нет последних обновлений и кое-какие ссылки не работают. но кое-что есть. плюс, там все еще работает форум, попробуйте поспрашивать там.


461. Alex, 15:26:41 [ответить]
      Люди, а не знает ли кто, что случилось с библиотекой GreyLib?


СООБЩЕНИЯ ЗА 23.11.2003
460. Павел, Самара (libword@narod.ru) 08:54:40 [ответить]
      > 452. Кatia.
      > Кто-нибудь может объяснить, что случилось с библиотекой "Моя библиотека" по адресу www.libword.ru, кажется? Там книжки были по философии, филологии, с постраничной разбивкой. Сервер не пускает, говорит, что нарушение правил или ошибка. Очень жалко ресурс!
     
      К сожалению, сайт прикрыли. Пытаюсь опять востановить на "народе", но оттуда меня уже удаляли. Может быть и там я продержусь недолго.
      Предлагю всем желающим (тем, кто имеет такую возможность)разместить мой архив у себя совершенно бесплатно. Пишите. :((


СООБЩЕНИЯ ЗА 17.11.2003
458. А, M 22:23:41 [ответить]
      Замечания(предложения по ММ 453).
      Не все понял...
      Предложение -
      1) можно перевести обсуждение идеи в отдельный форум(возможно с иерархией сабжей) - чтоб параллельно разрабатывать и достраивать несколько тем(а не идти линейно) -это так - на досуге
     
      а так, вообще - гл вопрос - публикация - на Либ.ру отличный каталоги, в котором масса книг(тоже на Либ.ру:)..проблемы - чел сделал книжку и сделал сайт под нее, но хочет, чтоб она была в общем каталоге(поэтому требовать такого от Либ.ру нелогично - здесь только "свои" книжки в своем (возможно наиболее оптимальном) формате) - нельзя требовать, чтобы в каталоге на Либ.ру были книги не с Либ.ру, а ссылки на ресурсы в Сети(к тому, же вероятно, с ошибками, без курсива:), и в самых разных форматах(однако же тоже, вполне читаемых)) - в этом проблема, - значит надо создать такой механизм и такой каталог... Я преклоняюсь перед Либ.ру, более того, она никуда не денется и наверняка, авторы отдельных ресурсов не будут против, если книжки с их ресурсов будут со временем попадать на Либ.ру, однако же такой мета-каталог даст возможность делать новые книжки доступными сразу, не дожидаясь пока они появятся на Либ.ру(опять же, кто-то захочет сделать отдельный сайт, посвященный какой книжке(вдруг)) - ясно, он может зарег-ить его в поисковиках, но преимущество такого каталога(будет) как раз в том, что здесь (будут) готовые тексты(ссылки на них - почему мы ищем книги на Либ.ру а не через Рамблер) - в общем фишка в том, чтоб дать возможность оср-кам сразу ставить книги в такой каталог(минуя ММ:).. отсюда надо и плясать(кажись) - кого и как и кто будет регистрировать для такого доступа к такому каталогу...
      А может не надо никакой регистрации - просто один чел держит такой каталог - при нем гостевуха для новых книг - туда люди скидывают ссылки на новые (оср)тексты в сети, держатель мета-каталога просто смотрит в гостевухе, идет по ссылке - если текст на месте, ссылку на него в каталог по механизму типа из сабжа 450... Как я люблю распределенные системы(из-за их анархичности!)... и как трудно заставить их нормально работать:)))))( - но можно( - я верю в светлое анархическое будущее человечества:)


457. Zmiy, Минск (zmiy@inbox.ru) 15:15:58 [ответить]
      > 454. InFAiR.
      > > 453. Максим Мошков.
      > > Господа OCR'щики, я наконец осознал, как это все должно выглядеть (хотя бы в общих чертах).
      >
      > ...
      >
      > Интересно, что появилось слово "закрытый".
      > Итнересно, что значит "левые посетители"?
     
      "Зарегистрированные" - те, кто сканирует, вычитывает книги и предоставляет их для библиотеки.
     
      "Левые" - "незарегистрированные", читатели книг, посетители библиотеки.


456. Yesaulov, Moscow 13:13:48 [ответить]
      > 455. Yesaulov.
      > > 454. InFAiR.
      > > Итнересно, что значит "левые посетители"?
      >
     
      Тот, кто отсканировал, тот и "отвечает за базар", т.е. за соответствие оригиналу (публикации).
      А вот остальные и есть "левые", которые можут напортачить в тексте, после чего и сам черт не разберется...
     
      Я так понимаю.


454. InFAiR, хЖБ (infair@rusoil.net) 08:33:16 [ответить]
      > 453. Максим Мошков.
      > Господа OCR'щики, я наконец осознал, как это все должно выглядеть (хотя бы в общих чертах).
     
      О! Ура!
      Наконец появится место сбора ...
     
      Интересно, что появилось слово "закрытый".
      Итнересно, что значит "левые посетители"?


453. Максим Мошков, 03:00:08 [ответить]
      Господа OCR'щики, я наконец осознал, как это все должно выглядеть (хотя бы в общих чертах).
     
      Надо делать библиотеку библиотек - универсальный сайт для закачки отсканированных произведений, с самопубликацией по принципу http://zhurnal.lib.ru>http://zhurnal.lib.ru, но с очень серьезными дополнениями.
     
      Если вкратце: клубный (закрытый) вход - к текстам допускаются только зарегистрированные пользователи.
      Регистрируем только тех, кто сканирует и размещает книги.
     
      Для "левых" посетителей - открыты оглавления и списки произведений.
     
      Одновременно ведется параллельный суммарный список всех авторов из всех окр-разделов.
     
      Одновременно ведется список внешних линков на оригиналы книг.
     
      Одновременно пакетный импорт мета-списков.
     
      Авторизация, много-ранговые уровни доступа.
     
      Так это выглядит в наброске.
     
      Программировать все это начну с середины декабря.
     
      Подробности и т/з буду обсуждать здесь, в этой гостевой. Любые советы, замечания и пожелания - welcome.
     
      Пока работы не начаты, полезно и поспорить по основным пунктам этого проекта.


СООБЩЕНИЯ ЗА 16.11.2003
452. Кatia, 23:13:47 [ответить]
      Кто-нибудь может объяснить, что случилось с библиотекой "Моя библиотека" по адресу www.libword.ru, кажется? Там книжки были по философии, филологии, с постраничной разбивкой. Сервер не пускает, говорит, что нарушение правил или ошибка. Очень жалко ресурс!


СООБЩЕНИЯ ЗА 09.11.2003
451. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 02:16:27 [ответить]
      > 450. А.
      > Все может быть проще гораздо - смотрите -
      > 1. Каждый может на халяву сделать сайт.
      > 2. Кто хочет - сканит книгу и выкладывает ее на этот сайт - сами понимаете, кому нужна книга, дизайн(самого сайта) почти по барабану(типа собого знания html не нужно)
      > 3. Есть форумы как здесь - в виде гостевух - сообщение идет за сообщением, а есть(и тоже, кажись, можно найти халяву) - где можно образовывать иерархические(то есть древовидные) структуры - но это же может быть и структура библио-каталога - все просто - например - ветвь - классика, внутри нее, там не знаю, русская классика... - все как на Либ.ру - например(чтобы не изобретать велосипед)
      > 4. Тот, кто отсканил и сделал сайт - заходит в этот форум-каталог - находит автора, потом если он есть в этой ветке форума просто нажимает "добавить сообщение" и пишет в это сообщение в Теме - название отсканенной книги, а в тексте сообщения - вероятно просто урл с сайтом - ну, кстати и примечания можно туда же запихнуть при желании.. если автора нет - соответственно, в нужной ветке(например, "Русская классика") пишет имя автора(например, Пушкин:), - так открывается новый раздел каталога - новая ветка этого форума, чел туда заходит, снова жмет "Добавить сообщение" и уже заносит туда свою книжку...
      > 5. Все... Один такой мега-форум можно вообще открыть(теоретически, конечно:) для народа(вариант - сделать регистрацию на этом форуме по факту хотя бы одной отсканеной челом книжки), а второй - чистовой сделать - типа - кто за модератора - смотрит, если есть такой урл и т.д... Есть проблема возможного засорения, но зато как бы ничто не мешает чел-ку при желании выложить отсканенную книжку, в этом он становиться независим...
     
      Дык инициатива наказуема. Делайте, а мы Вас будем ругать за то, что у Вас не получится. А ежели Вам самими делать предлагаемое Вами не по силам, позвольте отнестись к сообщенному Вами как к пустым звукам.


СООБЩЕНИЯ ЗА 13.11.2003
450. А, M 21:04:53 [ответить]
      Все может быть проще гораздо - смотрите -
      1. Каждый может на халяву сделать сайт.
      2. Кто хочет - сканит книгу и выкладывает ее на этот сайт - сами понимаете, кому нужна книга, дизайн(самого сайта) почти по барабану(типа собого знания html не нужно)
      3. Есть форумы как здесь - в виде гостевух - сообщение идет за сообщением, а есть(и тоже, кажись, можно найти халяву) - где можно образовывать иерархические(то есть древовидные) структуры(кажется, например, такие(форумы) есть на by.ru) - но это же может быть и структура библио-каталога - все просто - например - ветвь - классика, внутри нее, там не знаю, русская классика... - все как на Либ.ру - например(чтобы не изобретать велосипед)
      4. Тот, кто отсканил и сделал сайт - заходит в этот форум-каталог - находит автора, потом если он есть в этой ветке форума просто нажимает "добавить сообщение" и пишет в это сообщение в Теме - название отсканенной книги, а в тексте сообщения - вероятно просто урл с сайтом - ну, кстати и примечания можно туда же запихнуть при желании.. если автора нет - соответственно, в нужной ветке(например, "Русская классика") пишет(тоже в "Теме" нового сообщения) имя автора(например, Пушкин:), - так открывается новый раздел каталога - новая ветка этого форума, чел туда заходит, снова жмет "Добавить сообщение" и уже заносит туда свою книжку...
      5. Все... Один такой мега-форум можно вообще открыть(теоретически, конечно:) для народа(вариант - сделать регистрацию на этом форуме по факту хотя бы одной отсканеной челом книжки), а второй - чистовой сделать - типа - кто за модератора - смотрит, если есть такой урл и т.д... Есть проблема возможного засорения, но зато как бы ничто не мешает чел-ку при желании выложить отсканенную книжку, в этом он становиться независим...
      Надо будет организовать поиск..


СООБЩЕНИЯ ЗА 07.11.2003
449. Alla, 19:25:22 [ответить]
      Gospoda professionali, pomogite razobratsa chto tut s kodirovkami sluchilos. Ranshe pisala na kirillice bez problem, teper ne poluchaetsia. Vse vozmozhnie shrifti v Winduzah podkluchila, vse kodirovki pereprobovala, ne poluchaetsia dazhe s konverterom - poka pishu v okne "Dobavit soobshenie", kirillica normalno chitaetsia, kak tolko posilau soobshenie v forum, na lente vilezaet fignia. Help!


448. Im Werden, Augsburg, Germany (info@imwerden.de) 11:50:02 [ответить]
      > 447. Sokolov.
      > > 442. А.
      > и делается попытка реализовать ее на практике.
     
      Gde??


447. Sokolov, N.Novgorod (sokolov_av@pochtamt.ru) 09:32:44 [ответить]
      > 442. А.
      > По сути форума - не по теме выложил в ОСR... - Так вот есть идея попроще Ершовской - наше дело что - книжки в Сети, теоретически неважно, где они будут.. Конечно зеркала Либ.ру и вся система =- неплохая гарнтия от сбоев, но в качестве вспомогательного этапа - можно делать очень - централизованными оставить лишь каталоги, а все, кто что отссканит будут порсто ставить книги куда(и как) смогут(сделать сайт сейчас не проблема) - после этого, они натурально заходят в этот каталог и просто ставят туда название своей книги и ес-но, ейный урл.. Дальшке уже, теоретически, Максим может их себе ставить(с нашего разрешения:), перекодировать в Либформат, но как бы система станет более (в общем-то совсем) открыта, динамична + не надо будет ждать и жаловаться, что кто-то чего не выложил... Механизм каталогов можно сделать даже просто в наборе форумов - по темам... Модерация, конечно нужна...Но можно сделать черновой и чистовой варианты для каждой темы.. Надо пропагандировать во власти е-библ-ки как общенародное достояние:)
     
      Технически эта идея уже рассматривалась мною и делается попытка реализовать ее на практике. Фактически должно иметься несколько online-каталогов, основное назначение которых - хранение каталожной информации, сами книги хранятся на сайтах типа Ершовского и архивах. Получение книги должно выглядеть: читатель делает запрос в один из каталогов (связанных между собой), сервер каталога перенаправляет запрос в подключенные в текущий момент online-библиотеки и ftp-архивы, пользователю выдается набор обнаруженных файлов, либо посылается e-mail'ом сам файл. При отсутствии в online-библиотеках запрос перенаправляется в базовые архивы системы. Ну и плюс утилиты, например, перекодировщики, переформатирование (для этого необходимо некоторая стандартизация описания текста произведения), упаковщики, вьюеры и пр. То есть что-то типа межбиблиотечной системы (МБС) -- читатель может сходить либо непосредственно в библиотеку, либо получить ее через МБС.


446. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 01:39:50 [ответить]
      > 442. А.
      > По сути форума - не по теме выложил в ОСR... - Так вот есть идея попроще Ершовской - наше дело что - книжки в Сети, теоретически неважно, где они будут.. Конечно зеркала Либ.ру и вся система =- неплохая гарнтия от сбоев, но в качестве вспомогательного этапа - можно делать очень - централизованными оставить лишь каталоги, а все, кто что отссканит будут порсто
     
      Сетевые просто библиотеки и сетевые библиотеки-указатели (содержащие с основном отсылки на другие сайты) делаются технически принципиально по-разному. Тут колоссальная техническая различительная специфика. Приходится выбирать "или-или". Поэтому оставьте в покое уважаемого Максима Евгеньевича, который делает и так свое дело выше всяких похвал. А ненужная головная боль ему совсем ни к чему.


СООБЩЕНИЯ ЗА 06.11.2003
445. А, M 21:24:21 [ответить]
      Предложение - сделать faq по скан-ю и преобразованиям форматов и поставить ссылку на эти 'faq'и вверху страницы(этого форума) на самом видном месте(рядом с ссылкой на Ершова) - чтоб "всяк сюда входящий" для начала при желании мог ознакомиться с передовыми достижениями в области OCR(и не повторять потом уже сказанное)


444. Zhuk, Южный 14:53:57 [ответить]
      все - сам разобрался :)


443. Zhuk, Южный 14:41:53 [ответить]
      ребята, подскажите, в чем дело - когда пытаюсь воспользоваться поиском, кодировка сама меняется и, что не вводи, результат - 0 найденных :( СПАСИБО :)


СООБЩЕНИЯ ЗА 05.11.2003
442. А, Mоscaw 22:42:00 [ответить]
      По сути форума - не по теме выложил в ОСR... - Так вот есть идея попроще Ершовской - наше дело что - книжки в Сети, теоретически неважно, где они будут.. Конечно зеркала Либ.ру и вся система =- неплохая гарнтия от сбоев, но в качестве вспомогательного этапа - можно делать очень - централизованными оставить лишь каталоги, а все, кто что отссканит будут порсто ставить книги куда(и как) смогут(сделать сайт сейчас не проблема) - после этого, они натурально заходят в этот каталог и просто ставят туда название своей книги и ес-но, ейный урл.. Дальшке уже, теоретически, Максим может их себе ставить(с нашего разрешения:), перекодировать в Либформат, но как бы система станет более (в общем-то совсем) открыта, динамична + не надо будет ждать и жаловаться, что кто-то чего не выложил... Механизм каталогов можно сделать даже просто в наборе форумов - по темам... Модерация, конечно нужна...Но можно сделать черновой и чистовой варианты для каждой темы.. Надо пропагандировать во власти е-библ-ки как общенародное достояние:)


СООБЩЕНИЯ ЗА 30.10.2003
441. bmn, Ярославль 08:28:30 [ответить]
      > 439. Максим Мошков.
      > > 438. Zmiy.
      > > > 436. bmn.
      > > > > Zmiy435. .
      > > А куда делось 435 сообщение!?
      >
      > Видимо, bmn жал на "ответить" а попал в "удалить"
      > (Такое и со мной иногда случалось) постинг придется заново заводить - unerase в гостевых я не сделал.
     
      Именно так и получилось. :)) Я жутко извиняюсь...


СООБЩЕНИЯ ЗА 29.10.2003
440. Zmiy, Минск (zmiy@inbox.ru) 11:54:33 [ответить]
      > 439. Максим Мошков.
      > > 438. Zmiy.
      > > > 436. bmn.
      > > > > Zmiy435. .
      > > А куда делось 435 сообщение!?
      >
      > Видимо, bmn жал на "ответить" а попал в "удалить"
      > (Такое и со мной иногда случалось) постинг придется заново заводить - unerase в гостевых я не сделал.
     
      Значит пора на "удалить" поставить запрос "а действительно ли вы хотите удалить"...


439. Максим Мошков, 10:41:39 [ответить]
      > 438. Zmiy.
      > > 436. bmn.
      > > > Zmiy435. .
      > А куда делось 435 сообщение!?
     
      Видимо, bmn жал на "ответить" а попал в "удалить"
      (Такое и со мной иногда случалось) постинг придется заново заводить - unerase в гостевых я не сделал.


СООБЩЕНИЯ ЗА 24.10.2003
438. Zmiy, Минск (zmiy@inbox.ru) 16:59:01 [ответить]
      > 436. bmn.
      > > Zmiy435. .
      > Ты все-таки мне не объяснил, зачем тогда авторы добавляют курсив в свои тексты, если и без него хорошо. :))
     
      А куда делось 435 сообщение!?


437. V.Voblin, 10:46:19 [ответить]
      Ещё о выделении. БЫвают случаи похлеще, чем курсив.
      В одной из книг ерри Пратчета один из героев "разговаривает" специальным шрифтом. Пренебречь этим невозможно, да и не нужно: шрифт существует и широко распространён в виде файла True Type; шрифт можно "утопить" (embed) в файл Word-а вместе с текстом книги, так что его увидит и тот пользователь, у которого фонт не установлен.
     
      Казалось бы, технически должно быть очень несложно "обучить" Файнридер этому фонту, взяв за образец файл True Type. У Файнридера есть средства "обучения", доступные пользователю. Но увы, ничего у меня не получается. Кривое оно какое-то, это обучение. И не фонту, а "язку", а в моём случае язык всё тот же, английский. А я уверен, что нужный вариант обучения существует: не вручную же они "обучали" систему трём-четырём стандартным фонтам, которые Файнридер распознаёт "стандартно".
     
      Может, кто сталкивался с подобной проблемой и нашёл решение?


436. bmn, Ярославль 10:29:08 [ответить]
      > Zmiy435. .
      Ты все-таки мне не объяснил, зачем тогда авторы добавляют курсив в свои тексты, если и без него хорошо. :))


СООБЩЕНИЯ ЗА 23.10.2003
434. bmn, Ярославль 08:23:50 [ответить]
      > Все равно не понимаю, каким макаром смысл текста может зависеть от курсива... Это же не формула, где убрав знаки получится
      Т.е. ты хочешь сказать, что не знаешь о таком понятии, как логическое ударение? И, если следовать твоим мыслям, авторы, вставляющие курсив в свои тексты, просто дураки, которым больше делать нечего? :)))


433. Andrej, Ekaterinburg (tverjakov@mail.ru) 07:46:09 [ответить]
      > 432. Zmiy.
      > > 430. Andrej.
     
     
      > А зачем Вам алгоритм? Есть же готовые программки, которые форматируют текст по ширине...
     
      Алгоритм мне затем, что мне хочется его использовать в макросах на VBA для форматировавания в Ворде (по ряду причин мне так удобнее). Максим Мошков мне его уже прислал, за что ему огромно благодарен!
     
      Вам тоже спасибо за ссылки - попробую и эти утилиты.


СООБЩЕНИЯ ЗА 22.10.2003
432. Zmiy, Минск (zmiy@inbox.ru) 23:55:42 [ответить]
      > 430. Andrej.
      > А-а-а... понятно. Я если и форматирую - то уже готовый текст. На http://www.akapo.narod.ru>http://www.akapo.narod.ru есть хорошая утилитка для форматирования текстовых файлов (txt_lst.exe).
     
     
      Дело не в том, что текст после ФР получается форматирован пробелами по ширине, а в том, что только в этом режиме ФР правильно распознает абзацы и путем несложных операций замены в редакторе можно получить корректный текст, который вставляется в Ворд и обрабатывать дальше...
     
     
      > Кстати , никто не может прислать мне (или здесь выложить) алгоритм форматирования пробелами - все равно: на Бейсике, Паскале, Перле, или просто алгоритм в абстрактном виде. Буду очень благодарен!
      >
      > (А то не очень понятно, какие тут общие принципы, чтобы в итоге красиво выглядело)
     
      А зачем Вам алгоритм? Есть же готовые программки, которые форматируют текст по ширине...
      Вот тут большой набор полезных программок от LLeo:
      http://lleo.aha.ru/soft/micrsoft.htm>http://lleo.aha.ru/soft/micrsoft.htm
      Из этого набора я раньше пользовался WORD_LST.COM - именно она форматирует текст по ширине...
     
      В крайнем случае попробуйте мою zd2t.exe. Она тоже форматирует текст по ширине... А в комплексе с cltxt.exe можно запросто переформатировать любой текст, у которого абзац выделен хотя бы двумя пробелами. При этом корректно удаляются неубранные переносы слов... Таких текстов с переносами полно и здесь и на fantast2.narod.ru...
     
      Есть еще похожая программка от Славы Алексеева PRK-TEXT.EXE. Ее можно скачать, поискав на ftp-серверах файл PRK-TEXT.HA.


СООБЩЕНИЯ ЗА 23.10.2003
431. Zmiy, Минск (zmiy@inbox.ru) 00:32:59 [ответить]
      > 429. Павел.
      > К вопросу о курсиве. Например, у Фолкнера в "Шуме и яросте" он просто необходим. Без курсива весь смысл ромна теряется. Я очень жалею, что у меня этот текст без курсива и надеюсь, что кто-нибудь все-таки займется восстановлением оного.
     
     
      Все равно не понимаю, каким макаром смысл текста может зависеть от курсива... Это же не формула, где убрав знаки получится белиберда. А текст - это же не набор слов, а связный набор предложений! И смысл потеряется, если только переставить слова в предложениях...


СООБЩЕНИЯ ЗА 22.10.2003
430. Andrej, Ekaterinburg (tverjakov@mail.ru) 17:33:41 [ответить]
      > 427. Zmiy.
      > > 426. Andrej.
     
      > >
      > > То есть как это?!! И 5-й и 6-й ФР распознают курсив (там скорее обратная проблема - иногда выделяют курсивом там, гда выделения нет). А Вы при сохранении используете опцию "Сохранять размер и начертание шрифта" (естественно, сохранять для этого надо в doc или html, а не в txt)?
      >
      > Я понимаю, что курсива не будет в тхт... ;)
      > Но в режиме "Тип страницы = Форматированный пробелами текст" ФР распознает курсив как обычный текст...
     
      А-а-а... понятно. Я если и форматирую - то уже готовый текст. На http://www.akapo.narod.ru>http://www.akapo.narod.ru есть хорошая утилитка для форматирования текстовых файлов (txt_lst.exe).
     
      Кстати , никто не может прислать мне (или здесь выложить) алгоритм форматирования пробелами - все равно: на Бейсике, Паскале, Перле, или просто алгоритм в абстрактном виде. Буду очень благодарен!
     
      (А то не очень понятно, какие тут общие принципы, чтобы в итоге красиво выглядело)


429. Павел, Самара 16:54:54 [ответить]
      К вопросу о курсиве. Например, у Фолкнера в "Шуме и яросте" он просто необходим. Без курсива весь смысл ромна теряется. Я очень жалею, что у меня этот текст без курсива и надеюсь, что кто-нибудь все-таки займется восстановлением оного.


Continue