Список форумов
|
Добавить сообщение
|
Правила
| 26.11.2024, вторник, 19:34:04
Ответ на сообщение в форуме
"Проблемы OCR и электронных библиотек"
:
Обязательно заполните поле:
Ваше имя
Обязательно заполните поле:
Текст сообщения
Ваше имя:
Город:
Е-Маil:
Сайт:
> [217. Metrodor]. > > [216. Вячеслав Сачков]. > > > [211. Metrodor]. > > > > [209. InFAiR]. > > > > > [208. Metrodor]. > > > > А. И. Вислый (директор по информатизации РГБ) пишет: > > > "В настоящий момент электронный фонд Российской государственной библиотеки насчитывает более 10 000 произведений. > > Поиск по каталогу фонда электронных изданий РГБ возвращает 420 ╚единиц хранения╩, описанных как принадлежащие к ╚Открытой русской электронной библиотеке╩ это проект РГБ, которому недавно исполнилось три года. Некоторые из них доступны только в стенах РГБ. > > Термин ╚единица хранения╩ здесь наиболее точный, потому что, например, ╚Демократия в Америке╩ де Токвиля представлена всего пятью-шестью страницами текста (в самой книге должно быть более пятисот). > > На
http://orel.rsl.ru
написано, что "вся" (т. е. и заимствованные "единицы хранения") электронная библиотека составляет 4344 книги и 134 диссертации. > > Пример подготовки текста для этой электронной библиотеки можно посмотреть на
http://orel.rsl.ru/nettext/foreign/seneka/seneka_pisma.htm
> > Особенно интересна последняя часть, примечания, где осталось большое количество ошибок распознавания. Так что принципы, которые формулируют для себя добровольные сканировщики и ocr щики, пока остаются недостижимыми для реальных библиотек (Slava Alexeew: ╚Могут сказать, что я - нудный. Hе согласен - электронные версии следует стараться отлизать: они будут доступны очень большому числу людей. Да и сами OCR + корректура - нудные дела в принципе╩, см.
http://www.fido-online.com/x/_-0?Msg?5&1739&239&a12
Сортировать форумы по возрастанию даты публикации?
(Использовать эту опцию не рекомендуется)