Список форумов |  Добавить сообщение |  Правила |  25.11.2024, понедельник, 11:37:38
СПИСОК ФОРУМОВ
25.11.2024
11:23 Главная гостевая книга библиотеки(3649)
24.11.2024
16:42 "Разыскиваются книжки", доска объявлений(15475)
20.11.2024
11:47 Обо всем - мнения(3131)
07:16 Русские впечатления о заграничной жизни(9431)
01.10.2024
13:10 Проблемы OCR и электронных библиотек(1967)
09.09.2024
04:35 Книжки, которые скоро будут выложены(47)
06.05.2024
02:06 О возвышенной поэзии(1568)
02.02.2024
15:33 Книжки, которые стоит прочитать(5187)
12.11.2023
00:25 Мнения читателей о дизайне библиотеки(1478)
Lib.Ru

Проблемы OCR и электронных библиотек
Тема форума: В этом форуме обсуждаются общие проблемы связанные с поддержкой электронных библиотек и сканированием книг.

А так же обсуждение статьи Вадима Ершова "О коллективных сайтах"

Отсортировано по [убыванию] [возрастанию]   

СООБЩЕНИЯ ЗА 21.03.2007
1085. Максим Мошков, 07:37:04 [ответить]
      > 1083. Александр.
      > Максим, две темы:
      > 1. Где можно ознакомиться (почитать материалы) с Круглым столом 17-03-2007 на ВВЦ?
     
      Пока не знаю. Если материалы будут доступны, я залинкую.


1084. Александр, 04:58:13 [ответить]
Сайт: belousenko.com
      > 1082. Инклер.
      > > 1081. Александр.
      > > > 1080. Инклер.
      > > > > 1078. Александр.
      > > >
      > > > > Друзья, вчера продавил стекло на своем сканере. Посоветуйте, что можно сделать?
      > > >
      > > >
      > > > Без сканера совсем никуда...
      > > Ха, подошла дочь, разобрала сканер голыми руками (без отверток)...
      >
      > Я искренне рад за Вас, Александр! Надеюсь видеть всё больше и больше книг в Вашей библиотеке!
     
      Спасибо. К сожалению, наши ряды сократились: Продан ушел в кругосветное плавание и, кажется, попросил политического убежища в Испании. Поэтому чаще - ну никак.


1083. Александр, 04:38:37 [ответить]
Сайт: belousenko.com
      Максим, две темы:
      1. Где можно ознакомиться (почитать материалы) с Круглым столом 17-03-2007 на ВВЦ?
      2. Посмотрел видео на НТВ, которое прислал Владимир Есаулов. Всё хорошо. Но хочется пожелать в будущем не идти на поводу у ведущих, которые абсолютно не были готовы к передаче. Эфирное время очень короткое, а сказать по существу надо многое. Поэтому надо брать бразды правления в свои руки, а они (тетки) пусть подстраиваются. Им всё равно надо убить эфирное время. Вели Вы себя достойно, а вот ведущие оставили о себе жалкое впечатление.
      (Для непосвященных - http://publ.lib.ru/cgi/forum/YaBB.pl?num=1174149689/)


СООБЩЕНИЯ ЗА 20.03.2007
1082. Инклер, Москва 05:02:13 [ответить]
      > 1081. Александр.
      > > 1080. Инклер.
      > > > 1078. Александр.
      > >
      > > > Друзья, вчера продавил стекло на своем сканере. Посоветуйте, что можно сделать?
      > >
      > >
      > > Без сканера совсем никуда...
      > Ха, подошла дочь, разобрала сканер голыми руками (без отверток)...
     
      Я искренне рад за Вас, Александр! Надеюсь видеть всё больше и больше книг в Вашей библиотеке!


1081. Александр, 04:45:40 [ответить]
Сайт: belousenko.com
      > 1080. Инклер.
      > > 1078. Александр.
      >
      > > Друзья, вчера продавил стекло на своем сканере. Посоветуйте, что можно сделать?
      >
      >
      > Без сканера совсем никуда...если нет возможности купить новый, я бы попросил заменить стекло в любом сервис-центре. Теоретически они должны быть стандартными.
     
      Ха, подошла дочь, разобрала сканер голыми руками (без отверток), почистила стекло, что-то там вставила, собрала обратно, подключила и работает как новенький. Правда, боюсь давить с прежней силой, но работает. Вот, молодежь! Какая мелочь, а сколько радости! Жизнь продолжается.


СООБЩЕНИЯ ЗА 19.03.2007
1080. Инклер, Москва 08:57:07 [ответить]
      > 1078. Александр.
     
      > Друзья, вчера продавил стекло на своем сканере. Посоветуйте, что можно сделать?
     
     
      Без сканера совсем никуда...если нет возможности купить новый, я бы попросил заменить стекло в любом сервис-центре. Теоретически они должны быть стандартными.


1079. test, 07:50:58 [ответить]
      > 1076. imwerden.
      > > 1070. test.
      > > Да и стоило бы открыть тексты на свободное редактирование с открытым мониторингом исправлений. С точки зрения обслуживания ru.wikisource.org допускает более высокую степень управляемости, чем ваш современный сайт, а вот популярность его стоит практически на нуле, да и литературы там сейчас очень мало.
      >
      > Приветствую!
      > Могу предоставить место для экспериментов. Я устанавливал и опробывал у себя wiki, но поддержки у братии не нашел. Для нового проекта это очень не плохая база для работы группы лиц над одним проектом. Но, в существующих условиях - каждый делает свое неавтоматическое дело... Пишите мне на майл - я вам открою доступ на спец. сервер для тестов...
      > imwerden () gmail.com
     
      А открой. Я писал тебе, но ответа не дождался.
      torfnn () yandex.ru


СООБЩЕНИЯ ЗА 18.03.2007
1078. Александр, 19:32:22 [ответить]
Сайт: belousenko.com
     
      Друзья, вчера продавил стекло на своем сканере. Посоветуйте, что можно сделать?


СООБЩЕНИЯ ЗА 16.03.2007
1076. imwerden, Muenchen 17:32:38 [ответить]
Сайт: imwerden.de
      > 1070. test.
      > Да и стоило бы открыть тексты на свободное редактирование с открытым мониторингом исправлений. С точки зрения обслуживания ru.wikisource.org допускает более высокую степень управляемости, чем ваш современный сайт, а вот популярность его стоит практически на нуле, да и литературы там сейчас очень мало.
     
      Приветствую!
      Могу предоставить место для экспериментов. Я устанавливал и опробывал у себя wiki, но поддержки у братии не нашел. Для нового проекта это очень не плохая база для работы группы лиц над одним проектом. Но, в существующих условиях - каждый делает свое неавтоматическое дело... Пишите мне на майл - я вам открою доступ на спец. сервер для тестов...
      imwerden () gmail.com


СООБЩЕНИЯ ЗА 14.03.2007
1073. Максим Мошков, 08:03:20 [ответить]
      > 1072. test.
      > (там собственно нужен PHP и MySQL, а у вас только Perl
     
      PHP и MySQL в данный момент установить некуда.
      Будет новый сервер - тогда посмотрим.


СООБЩЕНИЯ ЗА 13.03.2007
1072. test, 10:07:55 [ответить]
      > 1071. Максим Мошков.
      > > 1070. test.
      > > возможна ли интеграция az.lib.ru с ru.wikisource.org да и другими аналогичными проектами.
      >
      > Черт его знает. Вяло подумываю об этом. Скорее всего, если я в это ввяжусь, то вики буду заряжать на собственном движке.
     
      А тогда вопрос: нельзя ли установить на сайт Ершова движок wikimedia (там собственно нужен PHP и MySQL, а у вас только Perl по словам Ершова). Я думаю, что его бы он устроил, чем то что у него есть сейчас. От Вашего же движка он давно и напрочь отказался.


СООБЩЕНИЯ ЗА 12.03.2007
1071. Максим Мошков, 23:12:12 [ответить]
      > 1070. test.
      > возможна ли интеграция az.lib.ru с ru.wikisource.org да и другими аналогичными проектами.
     
      Черт его знает. Вяло подумываю об этом. Скорее всего, если я в это ввяжусь, то вики буду заряжать на собственном движке.
     
      > (ну что-то типа fb2, хотя я его не уважаю)
     
      Отношусь к фб2 с осторожностью.
     
      > Да и стоило бы открыть тексты на свободное редактирование с открытым мониторингом исправлений. С точки зрения обслуживания ru.wikisource.org допускает более высокую степень управляемости, чем ваш современный сайт, а вот популярность его стоит практически на нуле, да и литературы там сейчас очень мало.


1070. test, 22:23:23 [ответить]
      Максим, а вообще какие у вас планы на будущее? Меня интересует: возможна ли интеграция az.lib.ru с ru.wikisource.org да и другими аналогичными проектами. Поодиночке оно может и хорошо, но в куче интереснее да и накладок меньше. Трансформация текста книги в ваш любимый текст при соблюдении стандартов оформления (ну что-то типа fb2, хотя я его не уважаю) не составит проблем. Насколько я знаю, сейчас активных редакторов у вас только 2, остальные же через некоторое время сбегают. Да и стоило бы открыть тексты на свободное редактирование с открытым мониторингом исправлений. С точки зрения обслуживания ru.wikisource.org допускает более высокую степень управляемости, чем ваш современный сайт, а вот популярность его стоит практически на нуле, да и литературы там сейчас очень мало.


1069. Maksim Moshkow, 15:05:42 [ответить]
      > 1068. Александр.
      > каким ридером вы пользуетесь,
     
      Rocket eBook REB1100
     
      > потому как кроме соньки
     
      Tozhe neploho


1068. Александр, г.Луцк, Украина (maslyuk@market.itt.net.ua) 11:57:34 [ответить]
      Смотрел ваше интервью на НТВ, вдохновляет,Максим подскажите каким ридером вы пользуетесь, потому как кроме соньки за 350+50$ в инете ничего дешевле не нашел...огромное спасибо за то что вы есть...


СООБЩЕНИЯ ЗА 09.03.2007
1066. Max Fornit, (fornitm@yahoo.com) 03:13:16 [ответить]
      Я не понял, а где ведется журнал убитых книг и разделов?
      Таких как
      http://lib.ru/LEM/
      http://lib.ru/PELEWIN/
      И прочих?
      Неужели об этом запрещено сообщать?


СООБЩЕНИЯ ЗА 06.03.2007
1065. Cемён, 10 км от Армагеддона 21:55:52 [ответить]
      > 1063. Мари.
      > Здравствуйте!
      > Скажите, пожалуйста, если я буду сканировать тексты для вашей библиотеки, мне будут это как-то оплачивать?
      >
      > С уважением, Мари.
     
      Будут.
      Большим спасибом.


1063. Мари, (maria-ta@yandex.ru) 19:51:20 [ответить]
      Здравствуйте!
      Скажите, пожалуйста, если я буду сканировать тексты для вашей библиотеки, мне будут это как-то оплачивать?
     
      С уважением, Мари.


СООБЩЕНИЯ ЗА 21.02.2007
1056. Алексей, Ростов-на-Дону (lordaragon1@mail.ru) 14:00:40 [ответить]
      Поздравляем всех с наступающим праздником 23 февраля, всех кто нас помнит
      Создатели библиотеки OCR Anonimous


СООБЩЕНИЯ ЗА 15.02.2007
1053. test, 14:02:04 [ответить]
      > 1051. Павел.
      > > 1049. Любопытствующий.
      > > > 1041. Павел.
      > > > > 1038. Vladimir.
      > > > > Почему в ftp://lib.ru/pub/moshkow/.library/ сейчас не хватает файлов, описанных в MD5SUM.txt? Размер li20041015.cpz вообще нулевой...
      > > >
      > > > А где вообще написано про ftp://lib.ru/? Как пользоваться выложенными там файлами. Это что, архив? Какой архиватор?
      > >
      > > Заглянул ради интереса. Архив библиотеки в SHAR + GZIP, по крайней мере так я перевел результат осмотра файла .cpz...
      > Вот спасибо
      Кстати, если кто не в курсе, то 7zip последних версий должен поддерживать сию нестандартную для виндовсоидов упаковку...


СООБЩЕНИЯ ЗА 04.02.2007
1051. Павел, 10:18:47 [ответить]
      > 1049. Любопытствующий.
      > > 1041. Павел.
      > > > 1038. Vladimir.
      > > > Почему в ftp://lib.ru/pub/moshkow/.library/ сейчас не хватает файлов, описанных в MD5SUM.txt? Размер li20041015.cpz вообще нулевой...
      > >
      > > А где вообще написано про ftp://lib.ru/? Как пользоваться выложенными там файлами. Это что, архив? Какой архиватор?
      >
      > Заглянул ради интереса. Архив библиотеки в SHAR + GZIP, по крайней мере так я перевел результат осмотра файла .cpz. Конкретнее лучше спросить у пользователя Unix/Linux. Схема каталога: базовый архив + еженедельные обновления (в основном через неделю). Временами судя по всему архив сбрасывается в новую версию. Для получения последних обновлений достаточно загрузить файл apLAST.cpz. Архив библиотеки, кстати говоря, представляет копию сайта с форумами, скриптами и прочим; наверно, после распаковки будет воссоздана структура сайта lib.ru.
     
      Вот спасибо


СООБЩЕНИЯ ЗА 03.02.2007
1050. Люопытствующий, 09:52:00 [ответить]
      > 1042. Павел.
      > Кир Булычев. Звездный пес.
      > Наверное, при сканировании была пропущена страница (даже нет начала 5й главы). Ближе к концу 4й главы в Вашем варианте:
      > ...
      По-моему, для обновления логично заглянуть в az.lib.ru, найти там администратора и послать запрос ему лично. Мошков, вообще-то, в последнее время чаще использует волонтеров, чем сам лично. Адреса администраторов можно попробовать узнать также у yes(собака)lib.ru.


1049. Любопытствующий, 09:44:53 [ответить]
      > 1041. Павел.
      > > 1038. Vladimir.
      > > Почему в ftp://lib.ru/pub/moshkow/.library/ сейчас не хватает файлов, описанных в MD5SUM.txt? Размер li20041015.cpz вообще нулевой...
      >
      > А где вообще написано про ftp://lib.ru/? Как пользоваться выложенными там файлами. Это что, архив? Какой архиватор?
     
      Заглянул ради интереса. Архив библиотеки в SHAR + GZIP, по крайней мере так я перевел результат осмотра файла .cpz. Конкретнее лучше спросить у пользователя Unix/Linux. Схема каталога: базовый архив + еженедельные обновления (в основном через неделю). Временами судя по всему архив сбрасывается в новую версию. Для получения последних обновлений достаточно загрузить файл apLAST.cpz. Архив библиотеки, кстати говоря, представляет копию сайта с форумами, скриптами и прочим; наверно, после распаковки будет воссоздана структура сайта lib.ru.


СООБЩЕНИЯ ЗА 07.01.2007
1042. Павел, 08:46:30 [ответить]
      Кир Булычев. Звездный пес.
      Наверное, при сканировании была пропущена страница (даже нет начала 5й главы). Ближе к концу 4й главы в Вашем варианте:
     
      - Как всегда, только приблизительно, -- сказал профессор. -- Мы обычно летим от планеты к планете. Где интересно, задерживаемся, а если не повезло, летим дальше.
      /*Здесь пропущен большой фрагмент (см. ниже)*/
      - Это датчик для звездных псов, -- сказал он. -- Его за ночь сделали в нашем институте.
     
      Пропущенный фрагмент (взято с сайта http://www.rusf.ru/kb/ со страницы http://www.rusf.ru/kb/stories/zvezdnyj_pes/text-01.htm):
     
      /*Начало*/
      - Тогда вы возьмете с собой звездного пса, - сказал Милодар. - И пускай он сам приведет вас к планете, с которой прибыл.
      - Но как он это сделает? - удивился профессор.
      - Завтра узнаете.
     
      Глава пятая
      ОТЛЕТ 'ПЕГАСА'
     
      Утром все участники экспедиции собрались на космодроме.
      Звездный пес был очень доволен, что отправляется в путешествие. Он обнюхал все ящики и пакеты, а когда Алиса дала ему подстилку, отнес ее в угол кают-компании и разложил возле дивана, чтобы все знали, где он намерен спать.
      Пришли и провожающие.
      Мама проверила Алисину каюту и выяснила, что Алиса ее опять обманула и не взяла с собой теплых вещей. Всю жизнь Алиса воюет с мамой, потому что если дать маме волю, она тебя закутает в десять шуб и заставит ходить в валенках. Мама подозревала, что Алиса, как всегда, оставит дома теплые вещи, поэтому притащила с собой на космодром целую сумку свитеров, носков, курток, вязаных шапок и прочих ненужных настоящему путешественнику вещей.
      Пришел домашний робот Поля, который дал Алисе с собой альбомчик с монетами, чтобы она менялась ими на дальних планетах и пополняла коллекцию Поли, известного космического нумизмата, то есть собирателя монет.
      Пришла, конечно же, Динара. Она принесла концентрированные завтраки для звездного пса и специальные собачьи витамины.
      Потом появился Милодар.
      Он принес с собой шарик размером с грецкий орех.
      /*Конец*/


СООБЩЕНИЯ ЗА 22.12.2006
1041. Павел, 12:30:15 [ответить]
      > 1038. Vladimir.
      > Почему в ftp://lib.ru/pub/moshkow/.library/ сейчас не хватает файлов, описанных в MD5SUM.txt? Размер li20041015.cpz вообще нулевой...
     
      А где вообще написано про ftp://lib.ru/? Как пользоваться выложенными там файлами. Это что, архив? Какой архиватор?


СООБЩЕНИЯ ЗА 13.12.2006
1040. Денис, Ярославль 12:24:01 [ответить]
      Курт Воннегут. Сирены Титана.
     
      В предложениях:
      И толпа снаружи ничем не отличалась от тех
      толп, которвге собирались за стенами тюрьмы в ожидании казни."
      Опечатка которвге -> которые
      "
      У меня были
      такие красавицы, что любой мужик в космосе между Солнцем и
      Бетелыейзе плюхнется на пол и разревется, если такая скажет ему
      "здрасьте!".
     
      Бетелыейзе-> Бетельгейзе
     
      - Да, cap!- сказал шофер.- Кто-то вас оберегает, это уж
      точно!
     
     
      cap-> сэр


СООБЩЕНИЯ ЗА 13.11.2006
1038. Vladimir, Челябинск 11:07:29 [ответить]
      Почему в ftp://lib.ru/pub/moshkow/.library/ сейчас не хватает файлов, описанных в MD5SUM.txt? Размер li20041015.cpz вообще нулевой...


СООБЩЕНИЯ ЗА 02.11.2006
1037. Ихтик, Уфа 21:29:24 [ответить]
Сайт: ihtik.lib.ru/
      http://www.telnews.ru/news.php?id=1085
      Вечный вопрос, влияет ли распространение электронных книг на продажи книг печатных, получил развитие с появлением отечественной поисковой системы eBoogle, специализирующейся исключительно на книгах.
      Поисковый двигатель по электронным книгам: eboogle.ru


СООБЩЕНИЯ ЗА 27.10.2006
1036. kar-au-kla, 08:04:48 [ответить]
      Исправьте, пожалуйста, опечатку в тексте.
     
      Уважаемые администраторы!
      В тексте "Томас Гарди. Под деревом зеленым или Меллстокский хор", http://www.lib.ru/INPROZ/GARDI/gardi_tree.txt
      В самом конце, в "Примечаниях" есть такая фраза: "Героиня романа Фэнси Дэй - первоначальный эскиз прославленных жопских характеров Гарди."
     
      Исправьте, пожалуйста, "жопских" на "женских".


СООБЩЕНИЯ ЗА 11.10.2006
1034. татьяна, Винница (marmyshka_05) 21:26:13 [ответить]
Сайт: mail.ru
      > 983. Елена Вострикова.
      > > 28. Кир Санов.
      > > имеюца отсканированные буки. треба окаэрщика. оп всем вопросам на мыло.
      > >
      > > Кюртис - Молодожены
      > > У. Фолкнер - Деревушка (Поселок)
      > > Э. Ионеско - Лысая певица
      > > П. Лэне - Кружевница
      > > Ле Клезио - Мондо
      > > З. Ленц - Урок немецкого
      > > А. Мердок - Дитя слова
      > > Э. Олби - Что случилось в зоопарке
      > > Ж. Перек - Вещи
      > > Ф. Саган - Немного солнца в холодной воде
      > > Н. Саррот - Детство
      > > Триоле - Луна-парк. Розы в кредит.
      > > Э. Тайле - Обед в ресторане "Тоска по дому"
      > > Данные книги снанились для сдачи экзамена по истории зарубежной литературы на старших курсах филфака и ргф. распознав их, вы поможете очень многим людям, впрочем возможно и себе, так как некоторые книги очень редки.
      > > Далее учебники:// 1. Galperin I.R. Stylistics of English Language (уже почти весь распознан)
      > > 2. Иванова, Чахоян - История английского языка
      > > 3. Зражевская, Гуськова - Трудности перевода общественно-политического текста с англ. яз на русский.
      > > 4. Брайент Дж. Кретти - Психология современного спорта.
      > > В общем, отцы и дети OCR, не поленитесь :)


СООБЩЕНИЯ ЗА 26.08.2006
1033. Леший, 18:47:15 [ответить]
      > 1031. Редактор.
      > Потребность в сканировании гораздо больше, чем сканировщиков. :о)
      > Только заказчики и сканировщики не нашли еще друг друга. :о)
      Кстати, Редактор, к слову о заказчиках. Я предлагал и свои услуги как ФЭБ, так и РВБ. Хотя они и вроде бы искали тогда работников, но от них не получил никакого ответа. Больше попыток обращаться к ним я не предпринимал. Чем я (да и пожалуй большинство из нас) их не устраивают, я так и не понял. Так, как у них монтируются книги на сайтах (несмотря на громкие заверения насчет спец. разметки, по виду файлов мое суждение об ней скорее отрицательное, чем положительное), могут делать все. Если не доверяют качеству proofread, то можно было бы создать параллельную работу с проверкой и сбивкой результатов, повысив качество.
      Пытался я также поучавствовать в оцифровке советских журналов 20-х гг., но у них видите ли, грант закончился. Так вообще-то не работают.
      РВБ и ФЭБ видимо тоже живут за счет грантов и не заинтересованы в привлечении посторонних лиц.
      Крупные коммерческие же организации мало заинтересованы в привлечении посторонних лиц, т.к. неизбежно и обязательно возникнут проблемы с защитой контента. Возможны (и есть) разовые заказы от сравнительно небольших компаний, не делающие погоды.
      Так что никто никого особо и не ищет. Продавцу услуг ведь не интересно обучение потенциальных конкурентов?


Continue