Список форумов |  Добавить сообщение |  Правила |  28.11.2024, четверг, 03:46:54
СПИСОК ФОРУМОВ
28.11.2024
02:53 Главная гостевая книга библиотеки(3678)
24.11.2024
16:42 "Разыскиваются книжки", доска объявлений(15475)
20.11.2024
11:47 Обо всем - мнения(3131)
07:16 Русские впечатления о заграничной жизни(9431)
01.10.2024
13:10 Проблемы OCR и электронных библиотек(1967)
09.09.2024
04:35 Книжки, которые скоро будут выложены(47)
06.05.2024
02:06 О возвышенной поэзии(1568)
02.02.2024
15:33 Книжки, которые стоит прочитать(5187)
12.11.2023
00:25 Мнения читателей о дизайне библиотеки(1478)
Lib.Ru

Проблемы OCR и электронных библиотек
Тема форума: В этом форуме обсуждаются общие проблемы связанные с поддержкой электронных библиотек и сканированием книг.

А так же обсуждение статьи Вадима Ершова "О коллективных сайтах"

Отсортировано по [убыванию] [возрастанию]   

СООБЩЕНИЯ ЗА 21.02.2003
166. Eugene, Odessa 19:03:39 [ответить]
      > 163. Damirjan.
      > > 147. VV.
      > > Вопрос.
      > >
      > > Я пытаюсь соорудить один многостраничный файл-книжку из серии отсканированных greyscale страниц-картинок.
     
      А Я ПРЕДПОЧИТАЮ WEBEXE http://www.exe-book.ukrbiz.net>http://www.exe-book.ukrbiz.net


СООБЩЕНИЯ ЗА 22.02.2003
167. VV, 11:44:34 [ответить]
      > 165. InFAiR.
     
      > http://tom.imm.uran.ru/~u1318/djvu/djvu.htm>http://tom.imm.uran.ru/~u1318/djvu/djvu.htm
      > http://subscribe.ru/archive/radio.oldradio/200103/05200802.html>http://subscribe.ru/archive/radio.oldradio/200103/05200802.html
     
      Спасибо, но дежавю, увы, страдает тем же недостатком. Я потратил на немало времени и убедился, что он не годится для качественной графики. Например, опять же для иероглифов. Либо изображение смазано, либо оно по объёму больше, чем jpeg и даже чем правильно сделанный gif.
     
      Не то чтобы второй сорт, но близко к этому.
     
      Кстати, Коэльо это тоже касается.


168. Rashid, Earth-Mars (Rashid8@yandex.ru) 20:03:12 [ответить]
      вы что, абалдели совсем, что с самиздатом мошковским происходит?
      Этот форум самое близкое к теме место коммуникации! если еще работает, почему ни чьих комментариев нет?http://zhurnal.lib.ru/>http://zhurnal.lib.ru/


СООБЩЕНИЯ ЗА 24.02.2003
169. Ореховы-Фурс, Питер 03:12:24 [ответить]
      > 168. Rashid.
      > вы что, абалдели совсем, что с самиздатом мошковским происходит?
      > Этот форум самое близкое к теме место коммуникации! если еще работает, почему ни чьих комментариев нет?http://zhurnal.lib.ru/>http://zhurnal.lib.ru/
     
      Кошмар с Самиздатом, Рашид.
      Готовимся к эвакуации.
      Все молчат, некоторых страниц нет совсем, до трибуны не добраться. Пока наши разделы еще "живы", но закачиваем их на HD а всякий случай.


СООБЩЕНИЯ ЗА 25.02.2003
170. Гершон, Хеврон 13:33:48 [ответить]
      > 160. Zmiy.
      > > 159. Гершон.
      > > Пытался найти отсканированные книги Э.Севелы, ничего не нашёл, кроме нескольких произведений.
      > > Поэтому хочу отсканировать свои книги этого автора. Сканирование двойной страницы книги занимает 80 секунд моим старым сканером Mustek 600CP (без обработки OCR). Книг много, уж очень всё это долго.
      > > Какой всё таки быстрый сканер приобрести?
      > > Ещё раз спасибо за информацию.
     
     
      Я приобрёл сканер UMAX ASTRA 4700, подсоединил его через USB 2.
      Очень быстро отсканировал и отредактировал два произведения Э. Севелы "Почему нет рая на земле", "Викинг".
      Я не любитель читать с экрана компьютера, но преимущества книги и большого компьютера объединены в компьютере "для ладони" Palm, поэтому я перевёл полученные файлы в формат PDB.
      Но проблема в том, что у меня остались файлы в Word. Стирать их жалко, может быть они кому то нужны. Но хочу предупредить, что они не "доведены" до аккуратного состояния, форматирования по полям и.д. Произведений этих нет в интернете. Кроме этого в мои планы входит отсканировать остальные произведения Севелы и другое.
      Может быть кому то эти призведения интересны, токда бы я их выслал на FTP или Email.
      Спасибо.


171. Максим Мошков, (moshkow@systud.msk.su) 13:58:10 [ответить]
      > 170. Гершон.
      > Может быть кому то эти призведения интересны, токда бы я их выслал на FTP или Email.
     
     
      http://lib.ru/TXT/incoming.txt>http://lib.ru/TXT/incoming.txt


172. VV, 22:53:08 [ответить]
      > Я приобрёл сканер UMAX ASTRA 4700, подсоединил его через USB
     
      Если не секрет - почём купили?
      Спасибо.


СООБЩЕНИЯ ЗА 26.02.2003
173. Гершон, Хеврон 00:18:34 [ответить]
      > 172. VV.
      > > Я приобрёл сканер UMAX ASTRA 4700, подсоединил его через USB
      >
      > Если не секрет - почём купили?
      > Спасибо.
     
      Купил в интернете за 450 шекелей.
      Сегодня цена уже 550 шекелей (110 долларов)
      http://www.olsale.co.il/olsale/Main.aspx?type=1&Page=1>http://www.olsale.co.il/olsale/Main.aspx?type=1&Page=1


СООБЩЕНИЯ ЗА 27.02.2003
174. David, Boston (david38038@hotmail.com) 08:11:28 [ответить]
      > 170. Гершон.
      > Но проблема в том, что у меня остались файлы в Word. Стирать их жалко, может быть они кому то нужны. Но хочу предупредить, что они не "доведены" до аккуратного состояния, форматирования по полям и.д. Произведений этих нет в интернете. Кроме этого в мои планы входит отсканировать остальные произведения Севелы и другое.
      > Может быть кому то эти призведения интересны, токда бы я их выслал на FTP или Email.
      > Спасибо.
     
      Mne, b'vakasha, na e-mail. Toda raba.


СООБЩЕНИЯ ЗА 05.03.2003
175. MMM, 14:24:19 [ответить]
      я п╣я я


176. Сергей Сотников, Минск 22:39:41 [ответить]
      Доброго времени суток!
      Оформляя книги в формате pdf, столкнулся с проблемой. При создании содержания в виде закладок (bookmarks) переход не всегда осуществляется правильно. Если закладка находится близко к концу страницы (на глаз - сантиметров 5 и меньше), переход осуществляется на начало следующей страницы. Не знаете ли, как поступить?
      Использую Adobe Acrobat Business Tools 4.05.


СООБЩЕНИЯ ЗА 06.03.2003
177. PDF-Library, Augsburg, Germany (news@imwerden.de) 09:23:38 [ответить]
      > 176. Сергей Сотников.
      > Доброго времени суток!
      > Оформляя книги в формате pdf, столкнулся с проблемой. При создании содержания в виде закладок (bookmarks) переход не всегда осуществляется правильно. Если закладка находится близко к концу страницы (на глаз - сантиметров 5 и меньше), переход осуществляется на начало следующей страницы. Не знаете ли, как поступить?
      > Использую Adobe Acrobat Business Tools 4.05.
     
      К сожалению, ответа на Ваш вопрос дать не могу - никогда не пользовался Вашей программой, но совет: перенесите новую главу на следующую страницу, а то она у Вас в конце страницы начинается...


СООБЩЕНИЯ ЗА 14.03.2003
180. А.Бурцев, 21:10:38 [ответить]
      Приветствую всех, господа! В Интернете складывается уникальная ситуация, а именно - появилось VIP.KM.RU - электронная платная библиотека, поставившая своей целью, ни много, ни мало, - монополизацию эл.библиотек в Интернете! Вот так. Если вы еше не столкнулись с их деятельностью - у вас все приятное впереди. Я же поимел свое удовольствие, когда зашел к ним и обнаружил в платном секторе ряд книг с моей библиотеки (http://fantast2.narod.ru>http://fantast2.narod.ru). Меня это весьма заинтересовало, поскольку книги я вычитываю и сканирую сам, и я предложил им, как честным людям, дать на меня ссылку. (Я бы не сказал, что это так трудно и сложно сделать!). В ответ я получил уже два письма с угрозами и обвинениями меня во всех смертных грехах. К сожалению, они запретили мне публиковать эти письма (весьма предусмотритеольно), но никто не может мне запретить их пересказывать и выражать к ним свое отношение. В частности, они написали, что имеют своей целью вытеснение всех других библиотек из Сети. Они написали, что на мои собственные сканы имеют права исключительно они, крали их и будут красть для своего собственного обогащения (а цена за право пользования ихней библиотеки немалая - 10 баксов в месяц). И вы думаете, крадут сканы они только у меня? Я обнаружил у них книги, покраденные из библиотек: Мошкова, Бомануара, Альдебарана, Лео и многих других. Далее, насколько я их понял, они будут требовать от других убирать украденные сканы из своих библиотек ( у меня уже требуют). Сами они, судя по всему, ничего сканировать не собираются, ткак как с откровенной циничностью написаои мне - пусть дурачки сканируют и корячатся над книгами, а мы будем сливки снимать (так дешевле и проще) да еще пинать их при этом. И уж как страшно при этом грозят, ссылаясь на своих (очевидно многочисленных) юристов. Ну, юрист есть и у меня, и к следующей неделе он подготовит мне выдержки из свода законов, которые я помещу в своей статье.
      В заключение хочу сказать говподам из VIP.KM - воровство, стремление к монополии и наглые наезды - не лучшее начинание деятельности. Вас, как минимум, никто не будет уважать, да и денег, пожалуй, не заработаете.
      Андрей Бурцев.
      Кто хочет, может писать мне: [email protected]


СООБЩЕНИЯ ЗА 15.03.2003
181. Александр Продан, Кишинев (alexpro@enteh.com) 14:45:35 [ответить]
      > 180. А.Бурцев.
      > Приветствую всех, господа! В Интернете складывается уникальная ситуация, а именно - появилось VIP.KM.RU - электронная платная библиотека, поставившая своей целью, ни много, ни мало, - монополизацию эл.библиотек в Интернете!
     
      Посмотрел я их сайт. Такой же бардак, как и в большинстве бестолковых нетематических библиотек. Ничего никому они не продадут, за исключением тех случаев, когда популярные авторы будут передавать им эксклюзивные права, но эти же авторы предпочитают издаться обычным путем. То что воруют - какая беда. Все воруют, ведь если разобраться, то более половины сетевых библиотек пробавляется ворованным. Вся разница лишь в том, что эти ребята хотят на ворованном заработать. И вы верите, что это возможно? Не американцам же они собираются продавать, а нам. А мы ученые, все что нам нужно мы всегда без денег находим, начиная от операционных систем и кончая банальной порнухой. Так что непонятно, чего испугались. Мне лично просто смешно. Тем более, что мы то народ бескорыстный, выкладываем книги за так, а кто ими пользуется - уже не наше дело. Мы же не авторы этих книг. Для нас же есть и положительный момент, если книга попала в платную библиотеку, то может стоит ее прочесть, правда скачав из другой, бесплатной библиотеки. Будем считать, что эти ребята выполняют, причем совершенно бесплатно!!!, роль маркетолога, рекламщика. Бог им в помощь и дай бог не умереть с голоду.


СООБЩЕНИЯ ЗА 16.03.2003
182. Вячеслав Сачков, Троицк (u10642@dialup.podolsk.ru) 02:21:35 [ответить]
      > 181. Александр Продан.
      > > 180. А.Бурцев.
      > > Приветствую всех, господа! В Интернете складывается уникальная ситуация, а именно - появилось VIP.KM.RU - электронная платная библиотека, поставившая своей целью, ни много, ни мало, - монополизацию эл.библиотек в Интернете!
      >
      > Посмотрел я их сайт. Такой же бардак, как и в большинстве бестолковых нетематических библиотек. Ничего никому они не продадут,
     
      В общем-то я с Вами согласен, хотя меня начинает все больше тревожить одно обстоятельство. Скажем, еще полгода назад было легко найти произведения в электронном виде, скажем, Грибоедова. Яндекс выдавал их самыми первыми строчками. Сейчас уже не так. Совсем не так. Сначала пролистываешь пару страниц, где указываются сайты, торгующие бумажными книгами, потом помойки вроде КМ, потом, где-то на 4-й - 5-й странице начинают встречаться действительно солидные собрания. И эта ситуация становится все хуже и хуже. Взгляните теперь на то же самое глазами полного чайника в сетевой литературе. Он слышал, что, в принципе, можно файлы с книгами бесплатно получать, но слышал и о том, что есть платные. Что, он будет 10-20 страниц по Яндексу перелистывать, если ему какой-то текст очень нужен. Да нет. Купит у этих халтурщиков с КМ или у им подобных...


СООБЩЕНИЯ ЗА 17.03.2003
185. Leon, (ldnleon@yandex.ru) 15:40:39 [ответить]
      > 184. PDF-Library.
      > > 180. А.Бурцев.
      >
      Как правило, текст содержит кучу ошибок, поэтому писать, что "выверял такой-то" у меня рука не поднимается. Исключение, я сделал pdf из двухтомника Андроникова и написал, что отсканировано и вычитано Leon' ом, поскольку я его не вычитывал, а в тексте море ошибок - я снял с себя ответственность за качество текста.
     
     
      ldn-knigi: ответ PDF-Library
      - К вопросу об Андроникове: неясно для нас, где вы это "море" нашли? Все тексты, которые нами даются на странице, мы сверяем по крайней мере два раза, и с ОРИГИНАЛА. Так что, к чему это голословное утверждение? И какое отношение это имеет
      к письму Бурцева? Наверно, вы просто хотели всем показать и доказать, как отлично вы владеете русским языком: лучше , чем издательство, выпустившее эти книги.
      Кстати, по правилам приличия, если уж вы это "море" нашли, то неплохо было бы нас информировать - ведь книги находятся у вас уже давно. И еще. Книги с таким "морем" мы бы никогда не выложили у себя, с взятием на себя ответственности или нет.
      Книги Андроникова есть сейчас во многих других библиотеках, так что вам не надо делать над собой такое усилие.


СООБЩЕНИЯ ЗА 19.03.2003
186. Вячеслав Сачков, Троицк (u10642@dialup.podolsk.ru) 01:47:23 [ответить]
      В дополнение к прошлой мессаге. Собственно, никакой своей изюминки на КМ вообще нет. Ловили бы лохов любителей чейзов и акуниных - небольшая проблема. Но меня заинтересовала там позиция "Человек в поисках смысла" Виктора Франкла. Судя по заявленному объему, эта книга там полностью. А на деле ссылка тухлая. То ли файл порченый, то ли его вообще нет. Представим себе теперь человека, которому эта книга действительно нужна. Он платит 10 баков, а ему будут лапшу на уши вешать до бесконечности. Что это? Жульничество, по-моему, самое очевидное, однозначно.


188. test, test (test) 13:05:28 [ответить]
      test


189. Leon, (ldnleon@yandex.ru) 16:42:55 [ответить]
      > 187. PDF-Library.
      > >185.
      > Хочу извиниться: писал послание в плохом настроении. И я делаю ошибки и ошибки-опечатки и кучу всего другого...
     
      Извинение принято, прощено и забыто.
      Займемся дальше OCR.


СООБЩЕНИЯ ЗА 23.03.2003
190. Olaf, (olaf@rbcmail.ru) 15:11:35 [ответить]
      > К сожалению, они запретили мне публиковать эти письма (весьма предусмотритеольно)
      Извините Андрей, как можно запретить публиковать письма написаные Вам? Вы что перед прочтением поставили галочку в соглашении о неразглашении, или данные письма содержат государственные секреты?


СООБЩЕНИЯ ЗА 27.03.2003
191. Zmiy, Минск (zmiy@inbox.ru) 11:56:16 [ответить]
     
      СООБЩЕНИЕ ПОСЛАННОЕ В RU.OCR и SU.BOOKS
     
      ---------------------------------------
     
      Продолжение. Начало см. выше - 191.
     
     
      А теперь, уважаемые, расскажите в каких
      из указанных вариантов нарушаются авторские права и почему?
      Все варианты заканчиваются одной и той же фразой...
     
      Ответы типа "я так сказал, потому что я прав" или
      "это логично как дважды два" не принимаются!
      То, что я привел как раз является логичным(2x2=4) и нормальным.
      А то, что тут некоторые высказывают,
      больше смахивает на 2x2=5 (2x2=4 + 1 себе в карман...)
     
      Только не нужно тут доказывать, что такого не бывает,
      что эти варианты нереальны или что они очень редкие...
      Учитывайте кол-во библиотек в мире, тираж книги и т.д.
     
      Есть люди, которые никогда не будут читать книги на компьютере.
      Я знаю людей, которые покупают бумажные книги
      и не желают читать эл.тексты...
      А есть люди, которые читают и то, и то...
     
      Почему кто-то может бесплатно читать книгу,
      взятую в библиотеке или у знакомых,
      а другие, не имея такой возможности, должны что-то кому-то платить,
      боясь нарушить авторское право? Чем они хуже?
      Они же могут сесть, скажем, на поезд, приехать в город к знакомым,
      где есть библиотека, сходить туда и бесплатно прочесть книгу!?
      При этом автор ничего не получит!
      А затраты читателя налицо - билет на поезд и др.
     
     
     
      А вот некоторые авторы поступают просто неэтично и подло,
      выпуская одни и те же книги под разным названием,
      или выпуская сборники произведений, в которых
      повторяются более половины текстов,
      а нового - на несколько страниц...
     
     
     
      С уважением, Zmiy. ------------:-)
      [email protected]


192. Zmiy, Минск (zmiy@inbox.ru) 11:55:26 [ответить]
     
      СООБЩЕНИЕ ПОСЛАННОЕ В RU.OCR и SU.BOOKS
     
      ---------------------------------------
     
      Здравствуйте, уважаемые!
     
      Предлагаются для анализа несколько вариантов
      чтения экземпляра одной(!!!) книги.
      Все немного упрощено(в смысле купил, прочитал, не получил),
      но суть будет понятна...
     
      Принятые сокращения:
      Автор - автор книги и/или другие обладатели авторского права.
     
     
      1) БИБЛИОТЕКА (БУМАЖНАЯ)
     
      Библиотека покупает у автора книгу.
     
      +-> Читатель бесплатно читает книгу.
      | Книгу бесплатно читают члены семьи, друзья и т.д.
      | Читатель никому ничего не платит.
      +-- Автор ничего за это не получает.
     
     
      2) БИБЛИОТЕКА (БУМАЖНАЯ)
     
      Библиотека покупает у автора книгу.
     
      +-> Читатель небесплатно читает книгу.
      | Читатель выплачивает библиотеке N-ю сумму денег,
      | которая значительно меньше реальной стоимости книги.
      | Библиотека распоряжается этими деньгами, закупая новые книги и т.д.
      | Книгу бесплатно читают члены семьи, друзья и т.д.
      +-- Автор ничего за это не получает.
     
     
      3) ЧЕЛОВЕК
     
      Человек покупает у автора книгу. Читает сам.
      Книгу бесплатно читают члены семьи, друзья и т.д.
     
      +-> Читатель бесплатно читает книгу, купленную человеком,
      | который приходится читателю членом семьи, другом,
      | знакомым, знакомым знакомого и т.д.
      | Книгу бесплатно читают члены семьи, друзья и т.д.
      | Читатель никому ничего не платит.
      +-- Автор ничего за это не получает.
     
     
      4) ЧЕЛОВЕК
     
      Человек покупает у автора книгу. Читает сам.
      Книгу бесплатно читают члены семьи, друзья и т.д.
     
      +-> Человек безвозмездно отдает книгу в библиотеку.
      | Книгу в библиотеке читает читатель.
      | Читатель никому ничего не платит.
      +-- Автор ничего за это не получает.
     
     
      5) БУКИНИСТИЧЕСКИЙ МАГАЗИН
     
      Человек покупает у автора книгу. Читает сам.
      Книгу бесплатно читают члены семьи, друзья и т.д.
     
      +-> Человек сдает книгу в букинистический магазин,
      | получая за это сумму денег,
      | которая ниже реальной стоимости книги.
      |
      | Читатель покупает книгу в букинистическом магазине,
      | цена книги ниже реальной стоимости книги.
      | Книгу бесплатно читают члены семьи, друзья и т.д.
      +-- Автор ничего за это не получает.
     
     
      6) БИБЛИОТЕКА (ЭЛЕКТРОННАЯ)
     
      Человек покупает книгу, берет ее в библиотеке или у знакомых.
      Книгу бесплатно читают члены семьи, друзья и т.д.
      Человек книгу сканирует, вычитывает, оформляет, выкладывает в Интернет.
     
      +-> Читатель бесплатно скачивает текст книги. Читает сам.
      |
      +-- Автор ничего за это не получает.
     
     
      Продолжение см. ниже - 191.


193. InFAiR, Уфа (infair@rusoil.net) 17:09:02 [ответить]
      Я по традиции всех предшественников извиняюсь,
      но у Вас, уважаемый Zmiy,
      небольшая неточность.
     
      Издательство покупает у автора книгу
      (издательство платит налог)
      (автор платит налог)
      Издательство продает тираж магазину
      (издательство платит налог)
      (магазин платит налог)
      Магазин продает книгу читателю 1
      (магазин платит налог)
      (читатель платит налог)
      Читатель сканирует книгу и продает другим читателям
      (Читатель 1 платит налог)
      (Читатель 2 платит налог)
      Читатель 1 нарушил права автора
      (Читатель 1 платит адвокату, который платит налог)
      (Читатель 1 платит штраф деньгами с которых снят налог)
      (Автор получает компенсацию с которой платит налог)
      и т.д.
     
      Я всегда думал в чем же смысл
      дурацкого стихотворения "Дом, который построил Джек" ? ...


194. Zmiy, Минск (zmiy@inbox.ru) 17:46:04 [ответить]
      > 193. InFAiR.
      > Я по традиции всех предшественников извиняюсь,
      > но у Вас, уважаемый Zmiy,
      > небольшая неточность.
      > . . .
      > Читатель сканирует книгу и продает другим читателям
      > (Читатель 1 платит налог)
      > . . .
     
     
      А у Вас БОЛЬШАЯ неточность :
     
      Читатель сканирует книгу и выкладывает текст другим читателям безвозмездно!!!
      Мне да и другим OCRщикам за это никто ничего не платит!
      Попробуйте убедить меня в обратном...


195. Андрей, Екатеринбург 20:03:27 [ответить]
      > 192. Zmiy.
     
      > СООБЩЕНИЕ ПОСЛАННОЕ В RU.OCR и SU.BOOKS
     
      Уважаемый Zmiy!
     
      Я тоже прошу прощения, но, имхо, это разговор ни о чем (при том, что Вы, безусловно, правы).
     
      Копирайт родился вместе с печатным станком и умрет вместе с ним.
     
      То, что существующие законы об авторском праве неприменимы в эпоху информационных технологий, а такие термины, как "экземпляр" просто теряют смысл - вещи довольно очевидные, и, если бы не издательское (в широком смысле, включая звукозаписывающую и киноиндустрию) лобби, имхо, к этим законам относились бы все как к пережиткам, которые нужно по возможности быстрее привести в соответствие с реальностью, а до тех пор смешно применят буквально.
     
      (Как в конце 80-х и начале 90-х существовали, но не применялись статьи УК за спекуляцию и ряд других устаревших положений; как в некоторых штатах до недавнего времени существовали законы, предусматривающие наказание за супружескую неверность, но, естественно, не применялись, про них просто все забыли).
     
      Но в данном случае, сколько бы сетевые библиотекари и их читатели не возмущались - ничего такого не произойдет (опять-таки, имхо), в силу наличия этого самого издательского лобби.
     
      Так что, все упирается в один простой фактор: что больше - финансовые затраты, необходимые для полного искоренения "пиратства" или убытки от этого "пиратства".
     
      Пока что, первое, очевидным образом, больше. С течением времени и развитием технологий убытки издателей будут, конечно возрастать (до тех пор, пока издательское дело в нынешнем виде - изготовление материальных носителей с информацией - вообще не отдаст концы, как отдали концы извозчики после появления автомобилей), но будут возрастать и затраты, необходимые на борьбу с "пиратством". Так что, сегодняшний разрыв, скорее всего, сохранится и, возможно, даже будет увеличиваться.
     
      Так что, единственный (снова имхо) способ, каким копирайтеры могли бы добиться успеха - это остановить вот это самое развитие технологий. Однако, в истории подобные желание у тех или других группировок возникали довольно часто, но никогда не имели успеха, по крайней мере долгосрочного.
     
      Ну, и, наконец,не надо забывать о неизбежности лобби противоположной направленности: если для издателя появление книг в открытом доступе - это убытки, то для провайдера (а в конечном итоге и для производителя "железа") богатый и разнообразный контент в сети - наоборот, источник дохода.


СООБЩЕНИЯ ЗА 29.03.2003
196. Вячеслав Сачков, Троицк (u10642@dialup.podolsk.ru) 01:57:12 [ответить]
      > 194. Zmiy.
     
      Позвольте мне от всей души выразить Вам наиглубочашую Вам признательность. Я просто совершенно потрясен той колоссальной деятельностью, которую Вы до сих пор проделали и продолжаете делать. Поэтому выражаю Вам всяческую моральную поддержку как читатель, пользователь отснятых Вами книг, благодарность моя к Вам и восхмщение мое Вами безмерны...


197. Андрей, Екатеринбург 07:58:35 [ответить]
      > 196. Вячеслав Сачков.
      > > 194. Zmiy.
      >
      > Позвольте мне от всей души выразить Вам наиглубочашую Вам признательность. Я просто совершенно потрясен той колоссальной деятельностью, которую Вы до сих пор проделали и продолжаете делать. Поэтому выражаю Вам всяческую моральную поддержку как читатель, пользователь отснятых Вами книг, благодарность моя к Вам и восхмщение мое Вами безмерны...
     
      Полностью присоединяюсь. Распространяю также все вышесказанное и на самого В. Сачкова, А. Продана, Дотанов, Белоусенко и всех остальных!


СООБЩЕНИЯ ЗА 31.03.2003
198. Электронная библиотека - что дальше?, Уфа-2500 (infair@rusoil.net) 20:25:47 [ответить]
      Осталось поставить памятник и работу форума на этом завершить.
      Нисколько не умаляю титанического труда и самоотверженности энтузиастов.
      Однако было бы интересно узнать, чем закончится эта эпопея?
     
      Позволю себе обратить Ваше внимание на заголовок форума -
      ╚Проблемы OCR и электронных библиотек╩ и тему, что под ним.
     
      Если не затруднится пролистать материалы форума и архивы,
      можно заметить, что обсуждаются несколько вопросов:
      - техника
      - программные
      - структура и стандарты
      - нарушение прав авторов и нарушение прав нарушителей прав авторов
     
      Первые три вопроса дело техники, и проблем тут особенных нет.
      Права авторов дело времени (надеюсь, потребуется менее 50 лет).
      Допустим, Вам выделили млрд. $ или больше и вы знаете, как организовать дело.
      Допустим, через 3 года Вы будете смотреть на Р-5, как сегодня на 286-й.
      Допустим, через 5 лет Вы будете смеяться над терабайтом,
      как сегодня над Гейтсом, который в 81-м говорил: ╚640 КВ предел мечтаний╩.
      Допустим, в конце концов, Вы собрали всю информацию,
      которую печатали люди на бумаге
     
      Не станет ли к тому времени такая библиотека
      Бесполезным памятником человеческой цивилизации?


199. Андрей, 21:06:49 [ответить]
      > 198. Электронная библиотека - что дальше?.
      > Осталось поставить памятник и работу форума на этом завершить.
      > Нисколько не умаляю титанического труда и самоотверженности энтузиастов.
      > Однако было бы интересно узнать, чем закончится эта эпопея?
      >
      > Позволю себе обратить Ваше внимание на заголовок форума -
      > ╚Проблемы OCR и электронных библиотек╩ и тему, что под ним.
      >
      > Если не затруднится пролистать материалы форума и архивы,
      > можно заметить, что обсуждаются несколько вопросов:
      > - техника
      > - программные
      > - структура и стандарты
      > - нарушение прав авторов и нарушение прав нарушителей прав авторов
      >
      > Первые три вопроса дело техники, и проблем тут особенных нет.
      > Права авторов дело времени (надеюсь, потребуется менее 50 лет).
      > Допустим, Вам выделили млрд. $ или больше и вы знаете, как организовать дело.
      > Допустим, через 3 года Вы будете смотреть на Р-5, как сегодня на 286-й.
      > Допустим, через 5 лет Вы будете смеяться над терабайтом,
      > как сегодня над Гейтсом, который в 81-м говорил: ╚640 КВ предел мечтаний╩.
      > Допустим, в конце концов, Вы собрали всю информацию,
      > которую печатали люди на бумаге
      >
      > Не станет ли к тому времени такая библиотека
      > Бесполезным памятником человеческой цивилизации?
     
      Остается еще один вопрос: Зачем вы сюда пришли и к чему ваши
      бессмысленные вопросы?


СООБЩЕНИЯ ЗА 02.04.2003
200. Agey, Москва (agey@newmail.ru) 17:18:41 [ответить]
      To Zmiy, Минск ([email protected])
     
      Есть еще вариант:
     
      Читатель бесплатно качает книгу в сети.
      Читает. Она ему нравится и он покупает... два экземпляра. Притом подарочное издание. Один себе. Один в подарок к.-л.
     
      И все довольны.


СООБЩЕНИЯ ЗА 14.04.2003
205. Кирилл, Иркутск (titaev-k@yandex.ru) 18:46:55 [ответить]
      Господа.
      Я впервые на этом форуме хотя в вопросах e-lib (но!!! off-line)and OCR работаю уже около 4 лет. Не посоветуете ли, случайно, что почитать по ряду вопоросов?
      Поясню: у меня полуведомственная специализированая (социология)библиотека наименований эдак на 500 из которых проценто 10 - 15 отсканированы (но почти не вычитаны) только у нас.
      1. Имеют ли официальные претензии и как часто от авторов за незаконное использование их текстов?
      2. Имеют ли место претензии от других электронных библиотек за выкладку тектсов скачанных с этих библиотек некоторое время назад? Главна проблема - не знаю (а иногда не помню) что откуда качалось.
      3. Если кого-то, кто имеет возможность и интерес выложить у себя имеющиеся классические тектсы по социологии (типа: Э.Гидденс Социология, Д. Кола: политическая социология)тексты буду оч. рад выслать список и тексты. Подчеркну: тексты вычитаны на очень среднем уровне.
      Заранее благодарен.


СООБЩЕНИЯ ЗА 15.04.2003
206. Вячеслав Сачков, Троицк (u10642@dialup.podolsk.ru) 01:51:21 [ответить]
      > 205. Кирилл.
      > 1. Имеют ли официальные претензии и как часто от авторов за незаконное использование их текстов?
      А что такое незаконное использование текстов? представьте себе такую ситуацию. Вы покупаете в магазине какую-то книгу, потом даете почитать ее бесплатно энному количеству своих друзей. Какой дебил на Вас за это в суд подаст? Ситуация с выкладкой текста на сайт, с которого книги скачиваются бесплатно, - один к одному. Тут никакого нарушения никаких законов нет.
      > 2. Имеют ли место претензии от других электронных библиотек за выкладку тектсов скачанных с этих библиотек некоторое время назад? Главна проблема - не знаю (а иногда не помню) что откуда качалось.
      По моей практике очень просто. Иногда (очень-очень редко) я забываю (ленюсь) указать источник. Человек пишет мне: укажи, и я тотчас же это делаю. Все.
      > 3. Если кого-то, кто имеет возможность и интерес выложить у себя имеющиеся классические тектсы по социологии (типа: Э.Гидденс Социология, Д. Кола: политическая социология)тексты буду оч. рад выслать список и тексты. Подчеркну: тексты вычитаны на очень среднем уровне.
      Это не надо. А если по контент-анализу что-то есть, я разместил бы весьма охотно. И по комплексу вопросов корректности интервьюирования.


207. InFAiR, Уфа (infair@rusoil.net) 18:27:53 [ответить]
      > 205. Кирилл.
      Уважаемый Кирилл!
      Могу порекомендовать статью: http://www.gpntb.ru/win/ntb/ntb2002/7/f7_04.htm>http://www.gpntb.ru/win/ntb/ntb2002/7/f7_04.htm
      1. От себя могу добавить, что консультировался с 5-ю или 6-ю
      юристами, специализирующимися в области информационных технологий,
      но ни один из них не припомнит прецендента обращения автора
      по поводу нарушения авторских прав или выигранного дела,
      хотя по закону автор прав.
      2. Если библиотека выставляет текст свободно, то претензий
      организаторы, естественно предъявлять не могут.
      Более того, большое количество т.н. электронных библиотек
      в интернете формируются только за счет сбора уже имеющихся текстов.
      Более продвинутые - собирают ссылки на ресурсы.
      3. Было бы интересно ознакомиться со списком отсканированных книг.
      Более того было бы интересно собрать такие списки или ссылки на них в одном месте.
      Это необходимо для того, чтобы не сканировать повторно один и тот же материал
      и организовать обмен электронными книгами м/у библиотеками.
      В случае если обмен производится между личными коллекциями
      закон об авторском праве не нарушается.


СООБЩЕНИЯ ЗА 16.04.2003
208. Metrodor, (metrodor@rambler.ru) 07:54:31 [ответить]
      Национальная электронная библиотека
     
      К концу 2003 года откроется интернет-доступ в первую в России крупномасштабную национальную электронную библиотеку. Первым архивом, который можно будет посетить, не выходя из дома, станет диссертационный. Создание электронного информационного хранилища таких масштабов проводится в России впервые, хотя в интернет-пространстве уже функционируют шесть сайтов информационных коллекций. "Главным отличием будущей библиотеки, - пояснил начальник отдела библиотек министерства культуры РФ Евгений Кузьмин, - является широчайший охват всех направлений литературы". В отличие, например, от электронной библиотеки "Кирилла и Мефодия", которая специализируется на справочной литературе, национальное хранилище комплектуется из справочной, научно-популярной, учебной, художественной литературы, собрания научных диссертаций и даже некоторых "жемчужин" интернетного "информационного мусора". В новой библиотеке будет более миллиона единиц хранения. Пополняться она будет, в первую очередь, за счет фондов Российской государственной библиотеки. Кроме того, привлекаются материалы из других крупных библиотек Москвы, а также архива президента РФ. Все материалы будут "оцифровывать", комплектовать, каталогизировать и отправлять в электронное хранилище. Национальная библиотека планирует также заимствовать "оцифрованные" материалы из уже существующих хранилищ. Несмотря на огромную стоимость проекта (только первый вклад составил более 2,5 миллиона долларов, а ежегодные вложения запланированы на уровне не менее 500 тысяч долларов), доступ к библиотечной информации, скорее всего, будет бесплатным. При этом не исключается и создание платных рубрик, к примеру, редких книг или источников, "оцифрованных" на внебюджетные средства.
     
      Оригинал на http://www.mincultrf.ru/news.php?news_id=457>http://www.mincultrf.ru/news.php?news_id=457


209. InFAiR, Уфа (infair@rusoil.net) 09:31:59 [ответить]
      > 208. Metrodor.
     
      Что-то не сходится в расчетах.
     
      Допустим, 2,5 выделили и еще по 0,5 ежегодно в течение 10 лет всего 7,5.
      В средней книге 300 стр. (296, точнее); 1 млн. книг это 300 млн. стр.
      7 500 000$/ 300 000 000 стр. = 0,025 цента.
      Такую себестоимость
      (с учетом амортизации, производительности и ресурса техники)
      (без учета оплаты труда, эл. энергии, хранения и т.п.)
      никакая техника не даст.
     
      М.б. я неправильно понял термин ╚единица хранения╩?
      Или применяется супер-технология?
     
      А еще мне понравилось выражение
      ╚жемчужины╩ интернетского ╚информационного мусора╩


210. Metrodor, (metrodor@rambler.ru) 10:00:44 [ответить]
      > 209. InFAiR.
      > > 208. Metrodor.
      >
      > Что-то не сходится в расчетах.
      >
      > Допустим, 2,5 выделили и еще по 0,5 ежегодно в течение 10 лет всего 7,5.
      > В средней книге 300 стр. (296, точнее); 1 млн. книг это 300 млн. стр.
      > 7 500 000$/ 300 000 000 стр. = 0,025 цента.
      > Такую себестоимость
      > (с учетом амортизации, производительности и ресурса техники)
      > (без учета оплаты труда, эл. энергии, хранения и т.п.)
      > никакая техника не даст.
      >
      > М.б. я неправильно понял термин ╚единица хранения╩?
      > Или применяется супер-технология?
      >
      > А еще мне понравилось выражение
      > ╚жемчужины╩ интернетского ╚информационного мусора╩


211. Metrodor, (metrodor@rambler.ru) 10:38:16 [ответить]
      > 209. InFAiR.
      > > 208. Metrodor.
     
      > М.б. я неправильно понял термин ╚единица хранения╩?
      > Или применяется супер-технология?
     
      А. И. Вислый (директор по информатизации РГБ) пишет:
      "В настоящий момент электронный фонд Российской государственной библиотеки насчитывает более 10 000 произведений. Однако в 2003 скорость его наполнения будет существенно увеличена за счет:
      1. Увеличения объемов оцифровки на собственной базе и по договорам с другими организациями 6000 документов (книг) за год.
      2. Поиска полных текстов книг, размещенных в Интернет в свободном доступе и копирования их в электронный фонд 5000 документов (книг) за год.
      3. Организации поточного сканирования диссертаций, поступающих в РГБ 25000 диссертаций в год.
      Такой объем новых поступлений (порядка 35 000) сравним с объемом книжной продукции России за год (порядка 50 000 60 000) и требует новых технологических и организационных решений, ведущих к созданию Национальной электронной библиотеки на базе Российской государственной библиотеки. Важнейшими направлениями работ на 2003г. являются: разработка электронного каталога книг, оцифрованных в России, и его постоянное пополнение, создание списков книг для перспективной оцифровки, разработка технологии доступа читателей к полным текстам в условиях отсутствия высокоскоростных каналов в регионах России, разработка нормативных документов, обеспечивающих функционирование Национальной электронной библиотеки".
     
      Так что 1 миллион единиц хранения - это ошибка пресс-релиза.


212. Metrodor, (metrodor@rambler.ru) 10:59:50 [ответить]
      > 209. InFAiR.
      > > 208. Metrodor.
      >
      > Допустим, 2,5 выделили и еще по 0,5 ежегодно в течение 10 лет всего 7,5.
     
      На пресс-конференции, посвященной объявлению о создании Национальной электронной библиотеки, Е. И. Кузьмин (начальник отдела библиотек Мин. культуры) говорил о том, что министерские деньги "стоят" очень дорого и условно составляют пятую часть от общей стоимости проекта.
     
      Т. е. всего проект национальной электронной библиотеки стоит $2,5 млн. в год?


213. InFAiR, Уфа (infair@rusoil.net) 13:23:21 [ответить]
      > 212. Metrodor.
      > > 209. InFAiR.
      > > > 208. Metrodor.
     
      Возьмем в руки калькулятор
      2 500 000$/ (35 000 * 300) = 0,24 $/стр.
      На таких условиях я согласен
      перевести в электронный вид до 10 тыс. книг (3 млн. стр.) в год.
      Опыт имеется: www.elibrary.sitecity.ru
     
      В сообщении ╧209 вместо ╚цента╩ следует читать ╚$/стр.╩


214. Metrodor, (metrodor@rambler.ru) 13:37:25 [ответить]
      > 213. InFAiR.
      > > 212. Metrodor.
      > > > 209. InFAiR.
      > > > > 208. Metrodor.
     
      > 2 500 000$/ (35 000 * 300) = 0,24 $/стр.
     
      Вислый говорит, что оцифровка 1 стр. диссертации (разрезать, отсканировать, сшить) обходится менее 2 руб., если точно помню, 1 р. 93 коп.
     
      То есть около 0,07 $/стр.


215. InFAiR, Уфа (infair@rusoil.net) 15:55:11 [ответить]
      > 214. Metrodor.
      > > 213. InFAiR.
      > > > 212. Metrodor.
      > > > > 209. InFAiR.
      > > > > > 208. Metrodor.
     
      Согласен на 1,93 р/стр.


СООБЩЕНИЯ ЗА 17.04.2003
216. Вячеслав Сачков, Троицк (u10642@dialup.podolsk.ru) 01:42:57 [ответить]
      > 211. Metrodor.
      > > 209. InFAiR.
      > > > 208. Metrodor.
      >
      > > М.б. я неправильно понял термин ╚единица хранения╩?
      > > Или применяется супер-технология?
      >
      > А. И. Вислый (директор по информатизации РГБ) пишет:
      > "В настоящий момент электронный фонд Российской государственной библиотеки насчитывает более 10 000 произведений.
     
      Убожество. Я левой ногой на сиди пару дисков по 7 тысяч единиц накидал для для друзей и для знающих толк в литературе. Реально могу еще раз в 5 больше сделать. А мой вкус понимающим людям известен.
     
      Однако в 2003 скорость его наполнения будет существенно увеличена за счет:
     
      > 1. Увеличения объемов оцифровки на собственной базе и по договорам с другими организациями 6000 документов (книг) за год.
      > 2. Поиска полных текстов книг, размещенных в Интернет в свободном доступе и копирования их в электронный фонд 5000 документов (книг) за год.
     
      Уроды. Лодыри.
     
      > 3. Организации поточного сканирования диссертаций, поступающих в РГБ 25000 диссертаций в год.
      Лучше бы их совсем не поступало (это реплика в сторону).
     
      > Такой объем новых поступлений (порядка 35 000) сравним с объемом книжной продукции России за год (порядка 50 000 60 000) и требует новых технологических и организационных решений,
     
      Книжек, где не каждой странице мат и т.п. непотребщина? Пардон, не надо.


217. Metrodor, (metrodor@rambler.ru) 07:51:35 [ответить]
      > 216. Вячеслав Сачков.
      > > 211. Metrodor.
      > > > 209. InFAiR.
      > > > > 208. Metrodor.
     
      > > А. И. Вислый (директор по информатизации РГБ) пишет:
      > > "В настоящий момент электронный фонд Российской государственной библиотеки насчитывает более 10 000 произведений.
     
      Поиск по каталогу фонда электронных изданий РГБ возвращает 420 ╚единиц хранения╩, описанных как принадлежащие к ╚Открытой русской электронной библиотеке╩ это проект РГБ, которому недавно исполнилось три года. Некоторые из них доступны только в стенах РГБ.
     
      Термин ╚единица хранения╩ здесь наиболее точный, потому что, например, ╚Демократия в Америке╩ де Токвиля представлена всего пятью-шестью страницами текста (в самой книге должно быть более пятисот).
     
      На http://orel.rsl.ru>http://orel.rsl.ru написано, что "вся" (т. е. и заимствованные "единицы хранения") электронная библиотека составляет 4344 книги и 134 диссертации.
     
      Пример подготовки текста для этой электронной библиотеки можно посмотреть на http://orel.rsl.ru/nettext/foreign/seneka/seneka_pisma.htm>http://orel.rsl.ru/nettext/foreign/seneka/seneka_pisma.htm
     
      Особенно интересна последняя часть, примечания, где осталось большое количество ошибок распознавания. Так что принципы, которые формулируют для себя добровольные сканировщики и ocr щики, пока остаются недостижимыми для реальных библиотек (Slava Alexeew: ╚Могут сказать, что я - нудный. Hе согласен - электронные версии следует стараться отлизать: они будут доступны очень большому числу людей. Да и сами OCR + корректура - нудные дела в принципе╩, см. http://www.fido-online.com/x/_-0?Msg?5&1739&239&a12>http://www.fido-online.com/x/_-0?Msg?5&1739&239&a12


СООБЩЕНИЯ ЗА 19.04.2003
218. Вячеслав Сачков, Троицк (u10642@dialup.podolsk.ru) 05:02:14 [ответить]
      > 217. Metrodor.
     
      > Особенно интересна последняя часть, примечания, где осталось большое количество ошибок распознавания. Так что принципы, которые формулируют для себя добровольные сканировщики и ocr щики, пока остаются недостижимыми для реальных библиотек (Slava Alexeew: ╚Могут сказать, что я - нудный. Hе согласен - электронные версии следует стараться отлизать: они будут доступны очень большому числу людей. Да и сами OCR + корректура - нудные дела в принципе╩, см. http://www.fido-online.com/x/_-0?Msg?5&1739&239&a12>http://www.fido-online.com/x/_-0?Msg?5&1739&239&a12
      Теза на 99% имеет дело с априори вычитанными текстами. Т.е. 99% содержания фэхи "бук" - наколоченная на клавах фидошная графомания, определение "вычитка" к которой вовсе не применимо. А всего по его собственному публичному признанию у него по объему где-то столько же текстов, сколько здесь, т.е. approx. 36 gb. Но это все теория и абстракция, а реальность - тексты, "выдаваемые народу" в онлайне и оффлайне. Все признают, что здесь важнейший вопрос не вычитка, а выборка, отбор. Невооруженным взглядом видно, что в rsl (нац. сет. б-ка) введенный мною принцип отбора был заложен с двумя существенными отличиями, раскрывать которые не буду, но sapienti sat. Алексеев сам чешет репу сейчас насчет рубрикации и, судя по всему, чесать будет долго. Мне остается пожелать ему в этом только всяческих успехов, но упоминание его в контексте нашего флейма неуместно. Его проблемы все же не те, которые обсуждаются здесь.


219. Metrodor, (metrodor@rambler.ru) 17:00:36 [ответить]
      > 218. Вячеслав Сачков.
      > > 217. Metrodor.
     
      Контекст упоминания очень прост: в RU.OCR на днях обсуждались как раз приемы вычитки отсканированных текстов. Цитата взята из сообщения, озаглавленного ╚Что полезно сделать, считав текст после OCR╩.
     
      > Невооруженным взглядом видно, что в rsl (нац. сет. б-ка) введенный мною принцип отбора был заложен с двумя существенными отличиями, раскрывать которые не буду, но sapienti sat.
     
      В начале проекта OREL был сформирован список приоритетных для оцифровки изданий - один из фрагментов на http://orel.rsl.ru/rusistkult.htm>http://orel.rsl.ru/rusistkult.htm
     
      Если бы этот список был воплощен за три года существования проекта, OREL уже сейчас превратился бы в значимое явление. Но перечень уже оцифрованных в РГБ изданий не имеет ничего общего со списком приоритетных источников.
     
      Отсюда следует вопрос: после того, как будут освоены как минимум $500 тыс. государственных денег, сумеем ли мы увидеть электронные копии этих книг?
     
      Не окажется ли, что 25 тыс. диссертаций будут доступны только в стенах РГБ, потому что правовые проблемы с распространением диссертаций могут быть еще похлеще, чем с книгами?


СООБЩЕНИЯ ЗА 20.04.2003
220. Вячеслав Сачков, (nestor@inetcomm.ru) 05:55:19 [ответить]
      > 219. Metrodor.
      > > 218. Вячеслав Сачков.
      > > > 217. Metrodor.
      >
      > Контекст упоминания очень прост: в RU.OCR на днях обсуждались как раз приемы вычитки отсканированных текстов. Цитата взята из сообщения, озаглавленного ╚Что полезно сделать, считав текст после OCR╩.
      > Но перечень уже оцифрованных в РГБ изданий не имеет ничего общего со списком приоритетных источников.
      >
      Так ведь оно и хорошо, по-моему, что ничего общего не имеет.
      > Отсюда следует вопрос: после того, как будут освоены как минимум $500 тыс. государственных денег, сумеем ли мы увидеть электронные копии этих книг?
      >
      > Не окажется ли, что 25 тыс. диссертаций будут доступны только в стенах РГБ, потому что правовые проблемы с распространением диссертаций могут быть еще похлеще, чем с книгами?
     
      Очень даже вряд получится так. Объясню. Далеко не все диссертации по разным причинам публикуются, а их авторам это, понятно, не нравится. Так вот если с авторов брать совсем небольшую копеечку, несопоставимо меньшую по сравнению с изданием книги, то все расходы окупятся. Скорее всего, будет сделано примерно так.


Continue