Список форумов |  Добавить сообщение |  Правила |  26.11.2024, вторник, 17:25:50
СПИСОК ФОРУМОВ
26.11.2024
15:01 Главная гостевая книга библиотеки(3660)
24.11.2024
16:42 "Разыскиваются книжки", доска объявлений(15475)
20.11.2024
11:47 Обо всем - мнения(3131)
07:16 Русские впечатления о заграничной жизни(9431)
01.10.2024
13:10 Проблемы OCR и электронных библиотек(1967)
09.09.2024
04:35 Книжки, которые скоро будут выложены(47)
06.05.2024
02:06 О возвышенной поэзии(1568)
02.02.2024
15:33 Книжки, которые стоит прочитать(5187)
12.11.2023
00:25 Мнения читателей о дизайне библиотеки(1478)
Lib.Ru

Проблемы OCR и электронных библиотек
Тема форума: В этом форуме обсуждаются общие проблемы связанные с поддержкой электронных библиотек и сканированием книг.

А так же обсуждение статьи Вадима Ершова "О коллективных сайтах"

Отсортировано по [убыванию] [возрастанию]   

СООБЩЕНИЯ ЗА 30.05.2003
262. Юрий, (mom_zlodey@mail.ru) 01:49:18 [ответить]
      А чего-нибудь с восстановлением Самиздата будет?


СООБЩЕНИЯ ЗА 29.05.2003
261. Лауренти Клаудио, Рим (claudion76@tin.it) 20:35:02 [ответить]
      > 260. п п╟п╡п╣п╩ п п╬п╩п╣п╡п╟я я я .
      > п п╬я п╡я я я п╣я пёп╩ п╡ я п╣я пё.... "п я п╨я я п╫п╣п╫п╨п╬ п╫п╟я пёп╫п╟п╣я п╠п╬я я п╠я я я п╩п╣п╨я я п╬п╫п╫я п╪пё п╨п╫пёпЁп╟п╪пё". п╔п╬я п╣п╩п╬я я п╠я я п╥п╫п╟я я п╪п╫п╣п╫пёп╣ п╟п╢п╪пёп╫пёя я я п╟я пё я п╟п╧я п╟.
      >
      > URL: http://www.computerra.ru/news/2003/5/28/39697/>http://www.computerra.ru/news/2003/5/28/39697/
      >
      > я я п╡п╟п╤п╣п╫пёп╣п╪.
     
     
      Понятное дело, уроды заокеанские проявляют свою настоящую натуру, когда речь идет о кровных. И такое прекрасное, бескорыстное чувство всемирного, интеллектуального единства, незаменимым средством которого является Интернет, для них станет проявлением "нецивилизованости", раз мешает выкачивать как можно больше бабок... Лицемерные, ненавистные люди.


260. п п╟п╡п╣п╩ п п╬п╩п╣п╡п╟я я я , п п╢п╣я я п╟ (seb@ukr.net) 18:42:05 [ответить]
      п п╬я п╡я я я п╣я пёп╩ п╡ я п╣я пё.... "п я п╨я я п╫п╣п╫п╨п╬ п╫п╟я пёп╫п╟п╣я п╠п╬я я п╠я я я п╩п╣п╨я я п╬п╫п╫я п╪пё п╨п╫пёпЁп╟п╪пё". п╔п╬я п╣п╩п╬я я п╠я я п╥п╫п╟я я п╪п╫п╣п╫пёп╣ п╟п╢п╪пёп╫пёя я я п╟я пё я п╟п╧я п╟.
     
      URL: http://www.computerra.ru/news/2003/5/28/39697/>http://www.computerra.ru/news/2003/5/28/39697/
     
      я я п╡п╟п╤п╣п╫пёп╣п╪.


259. Полупанов Евгений Владимирович, (zed@relcom.kz) 14:56:02 [ответить]
      > 257. Алекс.
      Я смотрю Вы пытаетесь вставить свой URL. Вот он:
      http://zhurnal.lib.ru/z/zabigajlo_a_o/>http://zhurnal.lib.ru/z/zabigajlo_a_o/


258. Полупанов Евгений Владимирович, (zed@relcom.kz) 14:46:02 [ответить]
      > 256. Алекс.
      > > 254. Полупанов Евгений Владимирович.
      > Привет , Евгений, я давно говорил что надо подниматься на борьбу.
      > Смело мы в бой пойдем...
     
      Александр Олегович! Рад Вас видеть! Я уж думал совсем один остался. Двое - нас уже толпа. Сплотим тесней наши ряды. В карманах оружие пролетариата, в руках знамя Победы, в умах бурное кипение творческой мысли.
      Наше дело правое! Победа будет за нами! Ура, товарищи!


257. Алекс, Ростов (alexz10@yandex.ru) 14:46:30 [ответить]
      > 255. Лауренти Клаудио.
      > > 254. Полупанов Евгений Владимирович.
      > > > 253. Юрий Погуляй.
      > > > > 252. Сергей Коваленко.
      > > > > Я не могу зайти в Самиздат, это у меня косяк, или у вас???
      > > Такая же фигня.
      > >
      > > > Видимо это у всех...
      > > Но если у всех, то почему все молчат?
      >
      > Ну да, это у всех такая проблема! А почему молчат, я не знаю. Я очень боюсь, это путиновцы дали приказ закрыть сайт...
     
     
      Да сначала сайт, а потом...
      Встава-а-а-а-й проклятием заклейменый....


256. Алекс, Ростов (alexz10@yandex.ru) 14:45:21 [ответить]
      > 254. Полупанов Евгений Владимирович.
      > > 253. Юрий Погуляй.
      > > > 252. Сергей Коваленко.
      > > > Я не могу зайти в Самиздат, это у меня косяк, или у вас???
      > Такая же фигня.
      >
      > > Видимо это у всех...
      > Но если у всех, то почему все молчат?
     
      Привет , Евгений, я давно говорил что надо подниматься на борьбу.
      Смело мы в бой пойдем...


255. Лауренти Клаудио, Рим (claudion76@tin.it) 02:26:25 [ответить]
      > 254. Полупанов Евгений Владимирович.
      > > 253. Юрий Погуляй.
      > > > 252. Сергей Коваленко.
      > > > Я не могу зайти в Самиздат, это у меня косяк, или у вас???
      > Такая же фигня.
      >
      > > Видимо это у всех...
      > Но если у всех, то почему все молчат?
     
      Ну да, это у всех такая проблема! А почему молчат, я не знаю. Я очень боюсь, это путиновцы дали приказ закрыть сайт...


СООБЩЕНИЯ ЗА 28.05.2003
254. Полупанов Евгений Владимирович, (zed@relcom.kz) 21:19:09 [ответить]
      > 253. Юрий Погуляй.
      > > 252. Сергей Коваленко.
      > > Я не могу зайти в Самиздат, это у меня косяк, или у вас???
      Такая же фигня.
     
      > Видимо это у всех...
      Но если у всех, то почему все молчат?


253. Юрий Погуляй, Питер (mom_zlodey@mail.ru) 12:35:08 [ответить]
      > 252. Сергей Коваленко.
      > Я не могу зайти в Самиздат, это у меня косяк, или у вас???
     
      Видимо это у всех...


252. Сергей Коваленко, Новосибирск (kesha112@ngs.ru) 12:06:56 [ответить]
      Я не могу зайти в Самиздат, это у меня косяк, или у вас???


СООБЩЕНИЯ ЗА 25.05.2003
251. тест, 22:05:44 [ответить]
      тест


250. тест, 22:00:36 [ответить]
      тест


249. чСЮЕУМБЧ уБЮЛПЧ, фТПЙГЛ (nestor@inetcomm.ru) 01:45:45 [ответить]
      > 248. Андрей.
      > Подскажите, пожалуйста.
      > Я задавал в поиск авторов (Ричард Бах, Дейл Карнеги) через окошко в левом верхнем углу - появляется реклама вверху листа, белое поле и больше ничего. :(
      > Как мне всё-таки вызвать книгу?
      > Заранее спасибо!
      По одному автору, пожалуйста. Прочие вопросы к Вашему психиатру. Я не специалист по общению с дебилами, к сожалению. Мой профиль - слепые и глухие. Умственно недоразвитые - не мой профиль.


СООБЩЕНИЯ ЗА 21.05.2003
248. Андрей, Москва (a696@dsk1.ru) 13:08:58 [ответить]
      Подскажите, пожалуйста.
      Я задавал в поиск авторов (Ричард Бах, Дейл Карнеги) через окошко в левом верхнем углу - появляется реклама вверху листа, белое поле и больше ничего. :(
      Как мне всё-таки вызвать книгу?
      Заранее спасибо!


247. CTAKAH, 00:24:28 [ответить]
      У меня книга из серии "Мастера современной прозы" Москва Прогресс 1979 Р.Рыбкин - "Исабель смотрит ...", "Сиеста ...", "У нас в городке...", "Незабываемый день...", "Вдова Монтель", "Искусственные розы", "Самый красивый...", "Последнее путешествие...".
      Так что...


СООБЩЕНИЯ ЗА 19.05.2003
246. В.Есаулов, Moscow (yes22vg@yandex.ru) 12:49:12 [ответить]
      > 245. Борис Бердичевский.
      > В общем, не о чем тут спорить, остается только гадать.
      > Либо Рыбкин сменил фамилию, либо взял псевдоним, либо Герман - другой человек (тогда получается не совсем красивый плагиат, - надеюсь, это не так), либо - опечатка в фамилии.
      > Я текст себе в библиотеку уже скопировал, по ходу дела подправил немного, буду вычитывать. А фамилию переводчика пока вставлю в двух вариантах.
     
     
      В качестве дополнения.
      В той же книге за Рыбкиным числится два рассказа:
     
      Незабываемый день в жизни Бальтасара
      У нас в городке воров нет
     
      Оба размещены на сайте "Макондо" (Акмулин Дмитрий)
      http://macondo.h1.ru/read.php?texts/baltasar.htm>http://macondo.h1.ru/read.php?texts/baltasar.htm
      http://macondo.h1.ru/read.php?texts/nothieves.htm>http://macondo.h1.ru/read.php?texts/nothieves.htm
      Там же и третий рассказ в переводе Рыбкина
      "Сиеста во вторник"
      http://macondo.h1.ru/read.php?texts/siesta.htm>http://macondo.h1.ru/read.php?texts/siesta.htm


СООБЩЕНИЯ ЗА 18.05.2003
245. Борис Бердичевский, Израиль (borisba@borisba.com) 02:09:29 [ответить]
      В общем, не о чем тут спорить, остается только гадать.
      Либо Рыбкин сменил фамилию, либо взял псевдоним, либо Герман - другой человек (тогда получается не совсем красивый плагиат, - надеюсь, это не так), либо - опечатка в фамилии.
      Я текст себе в библиотеку уже скопировал, по ходу дела подправил немного, буду вычитывать. А фамилию переводчика пока вставлю в двух вариантах.


СООБЩЕНИЯ ЗА 16.05.2003
244. В.Есаулов, Moscow (yes22vg@yandex.ru) 20:04:36 [ответить]
      > 243. Борис Бердичевский.
      > Я думаю, это сообщение сюда, на этот Форум.
      > Речь идет о переводчике романа Габриэля Гарсия Маркеса "Недобрый час".
      >
      > Вот что дано в заголовке текста у Мошкова:
     
      В общем-то не у Мошкова, а у меня.
      Посокльку ложной скромностью не страдаю, и себя указываю.:)
      Не отследил, что Максим указал мой старый проект.
     
      > Источник: Габриэль Гарсиа Маркес. Недобрый час. Роман и рассказы.
      > М.: Молодая гвардия, 1975. С. 13-158. Составление и перевод Р.Рыбкина.
      >
      > А вот - у меня книжка: Санкт-Петербург, издательский дом "Кристалл", 2001. Написано: переводчик Ростислав Герман, 1979.
      > Тексты, похоже, идентичны.
      > Не знаю, чему и кому верить. Склоняюсь к тому, чтобы верить бумаге, а не электронному тексту...
     
      Знаете, Борис, я тоже бумаге больше верю (эта книга у меня уже лет 25)..
      И "Молодая гвардия" не та была контора, чтобы пенку пускать.
      А вот издательский дом "Кристалл" я не знаю, и не знаю, стоит ли им верить.
      Хоть и не специалист по переводчикам Гарсиа Маркеса.
      Но помнится (где-то я встречал ссылку на Рыбкина) его звали Ростиславом.:)
      Поэтому есть гипотеза: Р.Рыбкин чудесным образом трансформировался к 2001 г. в Р.Германа.
      Псевдонимы у нас хоть и осуждали, но никто никогда их не запрещал.
      Более добавить нечего.
      С наилучшими пожеланиями,
      В.Е.


243. Борис Бердичевский, Израиль (borisba@borisba.com) 18:48:57 [ответить]
      Я думаю, это сообщение сюда, на этот Форум.
      Речь идет о переводчике романа Габриэля Гарсия Маркеса "Недобрый час".
     
      Вот что дано в заголовке текста у Мошкова:
     
      Источник: Габриэль Гарсиа Маркес. Недобрый час. Роман и рассказы.
      М.: Молодая гвардия, 1975. С. 13-158. Составление и перевод Р.Рыбкина.
     
      А вот - у меня книжка: Санкт-Петербург, издательский дом "Кристалл", 2001. Написано: переводчик Ростислав Герман, 1979.
      Тексты, похоже, идентичны.
      Не знаю, чему и кому верить. Склоняюсь к тому, чтобы верить бумаге, а не электронному тексту...


СООБЩЕНИЯ ЗА 15.05.2003
242. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 01:49:52 [ответить]
      > 225. Вячеслав Сачков.
      > > 224. Karl.
      > > Не знаю , по адресу ли я обрашаюсь, но очень хотелось , чтобы кто-то , если не помог , то хотя бы подсказал , куда обратиться . Скачал файл(огл(554k) 874 М.Джеймс, Д.Джонгвард. Рожденные выигрывать ) -это касательно Гештальт-терапии
     
      > Франкла я заканчиваю сканить и скоро выложу, а также Вертгеймера. Это действительно вещи, не то что нынешние псевдо- и антинаучные развлекалки для дураков.
     
      Как выяснилось, "В борьбе за смысл" Франкла уже отсканенана, у Некстера лежит http://lib.nexter.ru/cat/f/FRANKV01.htm>http://lib.nexter.ru/cat/f/FRANKV01.htm (кроме того, якобы на КиМ, но это неправда), поэтому рекомендую читать ее настоятельно. Кроме того, рекомендую книгу Ф.Е.Василюка на сайте Володи Донченко (забыл, как сайт называется, кажется, "Психология и самосознание", но интересующимся ясно, о чем идет речь). Кроме того, в обязательнейшем порядке, - А.Н.Леонтьев. На "Фронтистиписе" есть, у Донченко тоже быть должен и в других местах. В названии книги слово "Личность" имеется, а всего оно состоит из трех слов.


СООБЩЕНИЯ ЗА 12.05.2003
241. Максим Мошков, 11:55:00 [ответить]
      > 233. Gen.
      > Подскажите программку/утилитку/скрипт чтоб убрать "жесткие" переводы строк из книг скачанных из lib.ru?
     
      Войти в текст, нажать на "Содержание" вверху справа.
     
      Выбрать "TXT Word/КПК" --> Go


240. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 01:39:14 [ответить]
      > 239. Zmiy.
     
     
      >
      > Скачать программу можно тут : http://zmiy.da.ru>http://zmiy.da.ru
     
      Скачать не получается, дает отлуп по 403 (forbidden). Что за фигня?


СООБЩЕНИЯ ЗА 11.05.2003
239. Zmiy, Минск (zmiy@inbox.ru) 12:15:55 [ответить]
     
      Представляю на суд свою программу ZD2T вер.1.01.
     
      Программа ZD2T предназначена для конвертирования файлов MS Word *.doc и *.rtf, а также неформатированного текста *.txt, в форматированный текст DOS кодировки.
      Программа консольная, т.е. работает с командной строки, что удобно для применения ее в командных BAT-файлах.
      Основное применение программы - конвертирование электронных текстов.
     
      Скачать программу можно тут : http://zmiy.da.ru>http://zmiy.da.ru


СООБЩЕНИЯ ЗА 10.05.2003
238. Olga, cheboxsary (dominiq@inbox.ru) 21:12:45 [ответить]
      > 28. Кир Санов.
      > имеюца отсканированные буки. треба окаэрщика. оп всем вопросам на мыло.
      >
      > Кюртис - Молодожены
      > У. Фолкнер - Деревушка (Поселок)
      > Э. Ионеско - Лысая певица
      > П. Лэне - Кружевница
      > Ле Клезио - Мондо
      > З. Ленц - Урок немецкого
      > А. Мердок - Дитя слова
      > Э. Олби - Что случилось в зоопарке
      > Ж. Перек - Вещи
      > Ф. Саган - Немного солнца в холодной воде
      > Н. Саррот - Детство
      > Триоле - Луна-парк. Розы в кредит.
      > Э. Тайле - Обед в ресторане "Тоска по дому"
      > Данные книги снанились для сдачи экзамена по истории зарубежной литературы на старших курсах филфака и ргф. распознав их, вы поможете очень многим людям, впрочем возможно и себе, так как некоторые книги очень редки.
      > Далее учебники:// 1. Galperin I.R. Stylistics of English Language (уже почти весь распознан)
      > 2. Иванова, Чахоян - История английского языка
      > 3. Зражевская, Гуськова - Трудности перевода общественно-политического текста с англ. яз на русский.
      > 4. Брайент Дж. Кретти - Психология современного спорта.
      > В общем, отцы и дети OCR, не поленитесь :)


237. Gen, Reading, PA (gengladchun@hotmail.com) 21:10:47 [ответить]
      > 236. Сергей Сотников.
      > > 233. Gen.
      >
      > > Подскажите программку/утилитку/скрипт чтоб убрать "жесткие" переводы строк из книг скачанных из lib.ru?
      >
      > ClearTXT (http://www.gribuser.ru/freeware/cleartxt/index.shtml>http://www.gribuser.ru/freeware/cleartxt/index.shtml)
      > Мощная программа. Вот описание из хелпа:
      >
      > -----------------------------------------------------
      > Программа преобразует текстовые файлы в HTML. Параграфы, заголовки, эпиграфы и прочие элементы документа выявляются и сохраняются в виде форматирования HTML. Так же в программу встроен ╚Reader╩ со всеми необходимыми функциями.
      > Программа способна распознать практически любой текст, начиная от созданного в ╚лексиконе╩ и заканчивая псевдо-html из библиотеки Мошкова (с опорой на теги и вместо абзацев).
      > Широко понятная аналогия ╚автоформат╩ в MS Word. Разница (огромная) в качестве распознавания и возможностях управления процессом.
      > Если Вы хоть раз сталкивались с задачей переформатирования текстовых файлов, Вы уже знаете, насколько это непросто. Эта программа оправдает ваши самые смелые ожидания и сделает этот процесс если не элементарным, то максимально производительным и удобным как для End-Usera, так и для пользователя с особыми предпочтениями.
      > Reader позволяет делать заметки, закладки, форматировать весь документ под ваши предпочтения (например, сделать зеленый текст на черном фоне с шрифтом Verdana 14 пунктов) и многое другое. Все изменения (например, заметки) сохраняются и доступны в любом Web Browser-е.
      > Программа включает все операции, необходимые при работе с e-Book. Большинство электронных книг на русском существуют в виде текстовых файлов, с помощью этой программы Вы можете подготовить электронную книгу к чтению, настроить ее внешний вид в соответствии с вашими предпочтениями и комфортно прочитать ее.
      > -----------------------------------------------------
     
      Вот оно! Теперь с помощью дикой последовательностьи "txt c lib.ru" -> "ClearTxt: txt to Html" -> "convert.exe: сделать разбивку на слога в html" -> "MS Word: html to doc" -> "ReaderWorks: doc to lit" наконец то получил читабельный ebook в lit формате.
      Если не использовать Word, а пытаться конвертнуть html в lit сразу - в lite кракозябры вместо киррилицы.
     
      Но все же нсть одна проблема. Сделанные подобным образом книги читаются отлично yf notebookе, но не на moem PDA (Pocket PC, Dell Axim). Вместо букв - квадратики.
     
      Очевидно, что проблема со шрифтами. Другие книги, тоже сделанные RaederWorks, но немной, читаются отлично и на Notebook и на PDA. Их шрифт другой, и не такой крупный.
      Вопрос: можно ли узнать имена шрифтов оспользованных в lite?
      Можно ли их заменить? При генерации lita ReaderWorks'ом я не нашел никаких настроек связанных со шрифтами.
     
      Thanks,
      Gen


236. Сергей Сотников, Минск (sot_sub@tut.by) 00:32:21 [ответить]
      > 233. Gen.
     
      > Подскажите программку/утилитку/скрипт чтоб убрать "жесткие" переводы строк из книг скачанных из lib.ru?
     
      ClearTXT (http://www.gribuser.ru/freeware/cleartxt/index.shtml>http://www.gribuser.ru/freeware/cleartxt/index.shtml)
      Мощная программа. Вот описание из хелпа:
     
      -----------------------------------------------------
      Программа преобразует текстовые файлы в HTML. Параграфы, заголовки, эпиграфы и прочие элементы документа выявляются и сохраняются в виде форматирования HTML. Так же в программу встроен ╚Reader╩ со всеми необходимыми функциями.
      Программа способна распознать практически любой текст, начиная от созданного в ╚лексиконе╩ и заканчивая псевдо-html из библиотеки Мошкова (с опорой на теги и вместо абзацев).
      Широко понятная аналогия ╚автоформат╩ в MS Word. Разница (огромная) в качестве распознавания и возможностях управления процессом.
      Если Вы хоть раз сталкивались с задачей переформатирования текстовых файлов, Вы уже знаете, насколько это непросто. Эта программа оправдает ваши самые смелые ожидания и сделает этот процесс если не элементарным, то максимально производительным и удобным как для End-Usera, так и для пользователя с особыми предпочтениями.
      Reader позволяет делать заметки, закладки, форматировать весь документ под ваши предпочтения (например, сделать зеленый текст на черном фоне с шрифтом Verdana 14 пунктов) и многое другое. Все изменения (например, заметки) сохраняются и доступны в любом Web Browser-е.
      Программа включает все операции, необходимые при работе с e-Book. Большинство электронных книг на русском существуют в виде текстовых файлов, с помощью этой программы Вы можете подготовить электронную книгу к чтению, настроить ее внешний вид в соответствии с вашими предпочтениями и комфортно прочитать ее.
      -----------------------------------------------------


СООБЩЕНИЯ ЗА 09.05.2003
235. Gen, Reading, PA (gengladchun@hotmail.com) 15:47:35 [ответить]
      > 234. PDF-Library.
      > > 233. Gen.
      > > Привет,
      > >
      > > Подскажите программку/утилитку/скрипт чтоб убрать "жесткие" переводы строк из книг скачанных из lib.ru?
      > >
      > > Thanks,
      > > Gen
      >
      > Я уже научился это делать в Word с помощью "Найти-Заменить". >Сначала меняешь все концы строк (^p) на пробел. Затем шесть >пробелов на один конец строки, чтобы вернуть истинные абзацы. >Затем два пробела на один до тех пор, пока не скажут "0". >Затем меняешь кавычки "" на принятые в российской >типографии ╚╩. Затем текст прочитывается-вычитывается на >предмет: сносок, переводов иноязычных текстов, самих >иноязычных текстов, которые, будь они на французском, немецком >и многих-многих других языках имеют в любимом формате "txt" >кучу ошибок. Проверяются опечатки, текст сверяется с книгой >там, где написание вызывает сомнение. После этого книгу можно >читать...
     
      Нашел вот на Мухоморе ссылку на утилиту `convert` которая делает все что нужно.
     
      Но... по прежднему есть проблемы. Проблемы с кодировкой при использовании микрософтовского плагина для ворда. Если же я использую ReaderWorks, то для 2/3 книг он ругается на незакрытый тег в html.. :(
     
      Thanks,
      Gen


234. PDF-Library, Augsburg, Germany (news@imwerden.de) 12:18:32 [ответить]
      > 233. Gen.
      > Привет,
      >
      > Подскажите программку/утилитку/скрипт чтоб убрать "жесткие" переводы строк из книг скачанных из lib.ru?
      >
      > Thanks,
      > Gen
     
      Я уже научился это делать в Word с помощью "Найти-Заменить". Сначала меняешь все концы строк (^p) на пробел. Затем шесть пробелов на один конец строки, чтобы вернуть истинные абзацы. Затем два пробела на один до тех пор, пока не скажут "0". Затем меняешь кавычки "" на принятые в российской типографии ╚╩. Затем текст прочитывается-вычитывается на предмет: сносок, переводов иноязычных текстов, самих иноязычных текстов, которые, будь они на французском, немецком и многих-многих других языках имеют в любимом формате "txt" кучу ошибок. Проверяются опечатки, текст сверяется с книгой там, где написание вызывает сомнение. После этого книгу можно читать...


233. Gen, Reading, PA (gengladchun@hotmail.com) 00:37:20 [ответить]
      Привет,
     
      Подскажите программку/утилитку/скрипт чтоб убрать "жесткие" переводы строк из книг скачанных из lib.ru?
     
      Thanks,
      Gen


СООБЩЕНИЯ ЗА 29.04.2003
232. V.Yesaulov, Moscow (yes22vg@yandex.eu) 11:57:06 [ответить]
      > 231. Арон.
      > Когда создал они принадлежат то мне, а вот при размещении они официально принадлежат человеку который их размещает? Ведь я могу выдать чужое произведение за своё а будет написано что Копирайт у меня!
     
      Ну, сделать всё можно... Поэтому люди на Самиздате, размещая значочек копирайта, и заявляют тем самым, что претендуют на защиту своих авторских прав.
      А дальше уже судебная бодяга, если что не так. :)
      И лес дремучий до скончания веков. Вона, знаменитый голливудский фильм "Игра" (с Майклом Дугласом), вся идея украдена с романа Фаулза "Волхв". Но Фаулза отговорили судиться с... "Коламбия Пикчерз" (?) - никаких миллионов не хватит.
      Другой пример, недавно прошедший фильм "Ванильное небо" (С Томом Крузом и Пенелопкой Крус) не просто плагиат, а калька (т.е. под копирку) испанского "Открой глаза". Объявлена собственностью американского режиссера (очень знаменитого). Т.е. он просто купил права, и объявил себя автором. :)
      Пути Господни неисповедимы...


СООБЩЕНИЯ ЗА 28.04.2003
231. Арон, (aron@kropotkin.ru) 23:28:06 [ответить]
      > 230. V.Yesaulov.
     
      > Поскольку авторские права возникают в момент создания произведения (объекта авторских прав). И до...
     
      Когда создал они принадлежат то мне, а вот при размещении они официально принадлежат человеку который их размещает? Ведь я могу выдать чужое произведение за своё а будет написано что Копирайт у меня!


230. V.Yesaulov, Moscow (yes22vg@yandex.eu) 19:05:23 [ответить]
      > 229. Арон.
      > Здравствуйте, скажите пожалуйста Значок Копирайта рядом с фамилией автора действительно свидетельтсвует об его авторских правах на те произведения которые он публикует в разделе САМИЗДАТ или это означает что права принадлежат библиотеке lib.ru или что-то другое означает или вообще ничего? :)
     
      Ну, естественно автору...
      Поскольку авторские права возникают в момент создания произведения (объекта авторских прав). И до...
      А вот принадлежность Либ.ру или другим проектам (юр.лицам) подтверждаются юридически составленной бумагой на условиях, специально оговоренных (по срокам, условиям и прочая...).
      И вообще, Закон об этих самых (правах) трактуется как о праве на защиту этих самых прав.:о)


229. Арон, Кропоткин (aron@kropotkin.ru) 17:59:58 [ответить]
      Здравствуйте, скажите пожалуйста Значок Копирайта рядом с фамилией автора действительно свидетельтсвует об его авторских правах на те произведения которые он публикует в разделе САМИЗДАТ или это означает что права принадлежат библиотеке lib.ru или что-то другое означает или вообще ничего? :)


СООБЩЕНИЯ ЗА 25.04.2003
228. Сергей Сотников, Минск (sot_sub@tut.by) 12:43:37 [ответить]
      Вопрос вдогонку.
     
      Каким образом лучше оформлять одиночные переменные в тексте (типа x, y, z) -- просто выделять их курсивом, или вставлять как формулы (в Ворде, TEX-е)?


СООБЩЕНИЯ ЗА 24.04.2003
227. Сергей Сотников, Минск (sot_sub@tut.by) 15:55:47 [ответить]
      Друзья!
     
      Я занялся переводом в электронный вид книги "Вычислительная геометрия" (Препарата Ф., Шеймос M.). Соответственно столкнулся с необходимостью оформлять матетматические формулы. Опыта в этом деле у меня нет, так что надеюсь на вашу помощь.
      В результате хотелось бы получить HTML и PDF, но при этом желательно иметь некий "исходный" вариант с полным сохранением оформления - для исправления возможных ошибок в будущем (типа DOC, RTF, TEX, и т. п.).
     
      Вот что меня интересует:
      1. Какой формат посоветуете выбрать для "исходного" варианта книги? (Желательно подробнее, с учетом того, что будет три основных вида информации -- текст, формулы, рисунки. Ну и прочее - содержание, указатель, сноски).
      2. Какие существуют программы для работы с этим форматом и где их найти?
      3. Может, есть информация в Интернете по этим вопросам? Поделитесь ссылкой, пожалуйста.
     
      Текущий выбор - Word/MS Equation, в дальнейшем, возможно, преобразованный в TEX.


СООБЩЕНИЯ ЗА 23.04.2003
226. Karl, (karolkwiek100@hotmail.com) 13:32:28 [ответить]
      > 225. Вячеслав Сачков.
      > > 224. Karl.
      > > Не знаю , по адресу ли я обрашаюсь, но очень хотелось , чтобы кто-то , если не помог , то хотя бы подсказал , куда обратиться . Скачал файл(огл(554k) 874 М.Джеймс, Д.Джонгвард. Рожденные выигрывать ) -это касательно Гештальт-терапии , но , к сожалению , не могу открыть . Не знаю , какую программу следует инсталлировать .
      > > За ранее благодарен .
      > > Карл.
      >
      > Зачем всякую подобную дрянь читать? Франкла я заканчиваю сканить и скоро выложу, а также Вертгеймера. Это действительно вещи, не то что нынешние псевдо- и антинаучные развлекалки для дураков.
     
      Спасибо огромное за рекомендацию. Мне тяжело судить о том , что является вещами , а что - ширпотребной развлекаловкой, т.к. я , можно сказать , еще "зеленый" в этих вопросах. Но всё же хотелось бы ознакомиться с вышеупомянутым изданием . Как говорится : "Все познается в сравнении."


225. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 02:03:01 [ответить]
      > 224. Karl.
      > Не знаю , по адресу ли я обрашаюсь, но очень хотелось , чтобы кто-то , если не помог , то хотя бы подсказал , куда обратиться . Скачал файл(огл(554k) 874 М.Джеймс, Д.Джонгвард. Рожденные выигрывать ) -это касательно Гештальт-терапии , но , к сожалению , не могу открыть . Не знаю , какую программу следует инсталлировать .
      > За ранее благодарен .
      > Карл.
     
      Зачем всякую подобную дрянь читать? Франкла я заканчиваю сканить и скоро выложу, а также Вертгеймера. Это действительно вещи, не то что нынешние псевдо- и антинаучные развлекалки для дураков.


СООБЩЕНИЯ ЗА 22.04.2003
224. Karl, (karolkwiek100@hotmail.com) 04:30:27 [ответить]
      Не знаю , по адресу ли я обрашаюсь, но очень хотелось , чтобы кто-то , если не помог , то хотя бы подсказал , куда обратиться . Скачал файл(огл(554k) 874 М.Джеймс, Д.Джонгвард. Рожденные выигрывать ) -это касательно Гештальт-терапии , но , к сожалению , не могу открыть . Не знаю , какую программу следует инсталлировать .
      За ранее благодарен .
      Карл.


СООБЩЕНИЯ ЗА 21.04.2003
223. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 02:54:48 [ответить]
      > 221. Кирилл.
      > > 206. Вячеслав Сачков.
      > Спасибо большое за ответ. Если честно, не ожидал, что вообще
      Забыл еще проблематику корректности выборки указать, вообще все, что к комплексу вопросов выборки относится.


СООБЩЕНИЯ ЗА 20.04.2003
222. Лян, (liang@bk.ru) 19:36:46 [ответить]
      Ребята!
      Новому в сети проекту по изучению наследия и современности Востока Библиотеке российско-китайской дружбы требуются энтузиасты, увлечённые странами Востока, для совместной работы ( в основном это сбор книг и статей в ваших разделах). Вакантны следующие должности:
      Кураторы национальных разделов по:
      Вьетнаму
      Корее;
      Лаосу;
      Камбодже;
      Малайзии;
      Монголии;
      Тибету;
      Индии;
      Бангладешу;
      Пакистану;
      Ирану;
      Ираку;
      Странам Закавказья(грузия, армения - что-то одно);
      Казахстану;
      Киргизии;
      Странам Средней Азии (одну из стран);
      Афганистану;
      Турции;
      Филиппинам
      Странам Аравийского полуострова(одну из стран);
      Сирии;
      Ведущие рубрик
      ПО КИТАЮ:
      Китайская литература;
      истории Китая;
      Религии и философии Китая;
      единоборства Китая,
      китайская кухня
      Велдущие рубрик по Японии (аналогично)
      по Индонезии (аналогчично)
      [email protected]
      http://russ-chinfrien.narod.ru/>http://russ-chinfrien.narod.ru/
     
      Мы ждём вас!


221. Кирилл, Иркутск (titaev-k@yandex.ru) 10:16:03 [ответить]
      > 206. Вячеслав Сачков.
      Спасибо большое за ответ. Если честно, не ожидал, что вообще хоть кто-то откликнется.
      По контьент-анализу есть несколько текстов - примеров исследования, которые сейчас в печати или готовятся к публикации нашим исследовательским центром. Если это интересно - могу поговорить с коллегами, прислать. Ничего относительно фундаментального по этой тематике нет (и, по моему мнению очень сложно найти). По поводу корректности интервьюирования на днях должна появится публикация (подборка) на www.indepsocres.spb.ru


220. Вячеслав Сачков, (nestor@inetcomm.ru) 05:55:19 [ответить]
      > 219. Metrodor.
      > > 218. Вячеслав Сачков.
      > > > 217. Metrodor.
      >
      > Контекст упоминания очень прост: в RU.OCR на днях обсуждались как раз приемы вычитки отсканированных текстов. Цитата взята из сообщения, озаглавленного ╚Что полезно сделать, считав текст после OCR╩.
      > Но перечень уже оцифрованных в РГБ изданий не имеет ничего общего со списком приоритетных источников.
      >
      Так ведь оно и хорошо, по-моему, что ничего общего не имеет.
      > Отсюда следует вопрос: после того, как будут освоены как минимум $500 тыс. государственных денег, сумеем ли мы увидеть электронные копии этих книг?
      >
      > Не окажется ли, что 25 тыс. диссертаций будут доступны только в стенах РГБ, потому что правовые проблемы с распространением диссертаций могут быть еще похлеще, чем с книгами?
     
      Очень даже вряд получится так. Объясню. Далеко не все диссертации по разным причинам публикуются, а их авторам это, понятно, не нравится. Так вот если с авторов брать совсем небольшую копеечку, несопоставимо меньшую по сравнению с изданием книги, то все расходы окупятся. Скорее всего, будет сделано примерно так.


СООБЩЕНИЯ ЗА 19.04.2003
219. Metrodor, (metrodor@rambler.ru) 17:00:36 [ответить]
      > 218. Вячеслав Сачков.
      > > 217. Metrodor.
     
      Контекст упоминания очень прост: в RU.OCR на днях обсуждались как раз приемы вычитки отсканированных текстов. Цитата взята из сообщения, озаглавленного ╚Что полезно сделать, считав текст после OCR╩.
     
      > Невооруженным взглядом видно, что в rsl (нац. сет. б-ка) введенный мною принцип отбора был заложен с двумя существенными отличиями, раскрывать которые не буду, но sapienti sat.
     
      В начале проекта OREL был сформирован список приоритетных для оцифровки изданий - один из фрагментов на http://orel.rsl.ru/rusistkult.htm>http://orel.rsl.ru/rusistkult.htm
     
      Если бы этот список был воплощен за три года существования проекта, OREL уже сейчас превратился бы в значимое явление. Но перечень уже оцифрованных в РГБ изданий не имеет ничего общего со списком приоритетных источников.
     
      Отсюда следует вопрос: после того, как будут освоены как минимум $500 тыс. государственных денег, сумеем ли мы увидеть электронные копии этих книг?
     
      Не окажется ли, что 25 тыс. диссертаций будут доступны только в стенах РГБ, потому что правовые проблемы с распространением диссертаций могут быть еще похлеще, чем с книгами?


218. Вячеслав Сачков, Троицк (u10642@dialup.podolsk.ru) 05:02:14 [ответить]
      > 217. Metrodor.
     
      > Особенно интересна последняя часть, примечания, где осталось большое количество ошибок распознавания. Так что принципы, которые формулируют для себя добровольные сканировщики и ocr щики, пока остаются недостижимыми для реальных библиотек (Slava Alexeew: ╚Могут сказать, что я - нудный. Hе согласен - электронные версии следует стараться отлизать: они будут доступны очень большому числу людей. Да и сами OCR + корректура - нудные дела в принципе╩, см. http://www.fido-online.com/x/_-0?Msg?5&1739&239&a12>http://www.fido-online.com/x/_-0?Msg?5&1739&239&a12
      Теза на 99% имеет дело с априори вычитанными текстами. Т.е. 99% содержания фэхи "бук" - наколоченная на клавах фидошная графомания, определение "вычитка" к которой вовсе не применимо. А всего по его собственному публичному признанию у него по объему где-то столько же текстов, сколько здесь, т.е. approx. 36 gb. Но это все теория и абстракция, а реальность - тексты, "выдаваемые народу" в онлайне и оффлайне. Все признают, что здесь важнейший вопрос не вычитка, а выборка, отбор. Невооруженным взглядом видно, что в rsl (нац. сет. б-ка) введенный мною принцип отбора был заложен с двумя существенными отличиями, раскрывать которые не буду, но sapienti sat. Алексеев сам чешет репу сейчас насчет рубрикации и, судя по всему, чесать будет долго. Мне остается пожелать ему в этом только всяческих успехов, но упоминание его в контексте нашего флейма неуместно. Его проблемы все же не те, которые обсуждаются здесь.


СООБЩЕНИЯ ЗА 17.04.2003
217. Metrodor, (metrodor@rambler.ru) 07:51:35 [ответить]
      > 216. Вячеслав Сачков.
      > > 211. Metrodor.
      > > > 209. InFAiR.
      > > > > 208. Metrodor.
     
      > > А. И. Вислый (директор по информатизации РГБ) пишет:
      > > "В настоящий момент электронный фонд Российской государственной библиотеки насчитывает более 10 000 произведений.
     
      Поиск по каталогу фонда электронных изданий РГБ возвращает 420 ╚единиц хранения╩, описанных как принадлежащие к ╚Открытой русской электронной библиотеке╩ это проект РГБ, которому недавно исполнилось три года. Некоторые из них доступны только в стенах РГБ.
     
      Термин ╚единица хранения╩ здесь наиболее точный, потому что, например, ╚Демократия в Америке╩ де Токвиля представлена всего пятью-шестью страницами текста (в самой книге должно быть более пятисот).
     
      На http://orel.rsl.ru>http://orel.rsl.ru написано, что "вся" (т. е. и заимствованные "единицы хранения") электронная библиотека составляет 4344 книги и 134 диссертации.
     
      Пример подготовки текста для этой электронной библиотеки можно посмотреть на http://orel.rsl.ru/nettext/foreign/seneka/seneka_pisma.htm>http://orel.rsl.ru/nettext/foreign/seneka/seneka_pisma.htm
     
      Особенно интересна последняя часть, примечания, где осталось большое количество ошибок распознавания. Так что принципы, которые формулируют для себя добровольные сканировщики и ocr щики, пока остаются недостижимыми для реальных библиотек (Slava Alexeew: ╚Могут сказать, что я - нудный. Hе согласен - электронные версии следует стараться отлизать: они будут доступны очень большому числу людей. Да и сами OCR + корректура - нудные дела в принципе╩, см. http://www.fido-online.com/x/_-0?Msg?5&1739&239&a12>http://www.fido-online.com/x/_-0?Msg?5&1739&239&a12


216. Вячеслав Сачков, Троицк (u10642@dialup.podolsk.ru) 01:42:57 [ответить]
      > 211. Metrodor.
      > > 209. InFAiR.
      > > > 208. Metrodor.
      >
      > > М.б. я неправильно понял термин ╚единица хранения╩?
      > > Или применяется супер-технология?
      >
      > А. И. Вислый (директор по информатизации РГБ) пишет:
      > "В настоящий момент электронный фонд Российской государственной библиотеки насчитывает более 10 000 произведений.
     
      Убожество. Я левой ногой на сиди пару дисков по 7 тысяч единиц накидал для для друзей и для знающих толк в литературе. Реально могу еще раз в 5 больше сделать. А мой вкус понимающим людям известен.
     
      Однако в 2003 скорость его наполнения будет существенно увеличена за счет:
     
      > 1. Увеличения объемов оцифровки на собственной базе и по договорам с другими организациями 6000 документов (книг) за год.
      > 2. Поиска полных текстов книг, размещенных в Интернет в свободном доступе и копирования их в электронный фонд 5000 документов (книг) за год.
     
      Уроды. Лодыри.
     
      > 3. Организации поточного сканирования диссертаций, поступающих в РГБ 25000 диссертаций в год.
      Лучше бы их совсем не поступало (это реплика в сторону).
     
      > Такой объем новых поступлений (порядка 35 000) сравним с объемом книжной продукции России за год (порядка 50 000 60 000) и требует новых технологических и организационных решений,
     
      Книжек, где не каждой странице мат и т.п. непотребщина? Пардон, не надо.


СООБЩЕНИЯ ЗА 16.04.2003
215. InFAiR, Уфа (infair@rusoil.net) 15:55:11 [ответить]
      > 214. Metrodor.
      > > 213. InFAiR.
      > > > 212. Metrodor.
      > > > > 209. InFAiR.
      > > > > > 208. Metrodor.
     
      Согласен на 1,93 р/стр.


214. Metrodor, (metrodor@rambler.ru) 13:37:25 [ответить]
      > 213. InFAiR.
      > > 212. Metrodor.
      > > > 209. InFAiR.
      > > > > 208. Metrodor.
     
      > 2 500 000$/ (35 000 * 300) = 0,24 $/стр.
     
      Вислый говорит, что оцифровка 1 стр. диссертации (разрезать, отсканировать, сшить) обходится менее 2 руб., если точно помню, 1 р. 93 коп.
     
      То есть около 0,07 $/стр.


213. InFAiR, Уфа (infair@rusoil.net) 13:23:21 [ответить]
      > 212. Metrodor.
      > > 209. InFAiR.
      > > > 208. Metrodor.
     
      Возьмем в руки калькулятор
      2 500 000$/ (35 000 * 300) = 0,24 $/стр.
      На таких условиях я согласен
      перевести в электронный вид до 10 тыс. книг (3 млн. стр.) в год.
      Опыт имеется: www.elibrary.sitecity.ru
     
      В сообщении ╧209 вместо ╚цента╩ следует читать ╚$/стр.╩


212. Metrodor, (metrodor@rambler.ru) 10:59:50 [ответить]
      > 209. InFAiR.
      > > 208. Metrodor.
      >
      > Допустим, 2,5 выделили и еще по 0,5 ежегодно в течение 10 лет всего 7,5.
     
      На пресс-конференции, посвященной объявлению о создании Национальной электронной библиотеки, Е. И. Кузьмин (начальник отдела библиотек Мин. культуры) говорил о том, что министерские деньги "стоят" очень дорого и условно составляют пятую часть от общей стоимости проекта.
     
      Т. е. всего проект национальной электронной библиотеки стоит $2,5 млн. в год?


211. Metrodor, (metrodor@rambler.ru) 10:38:16 [ответить]
      > 209. InFAiR.
      > > 208. Metrodor.
     
      > М.б. я неправильно понял термин ╚единица хранения╩?
      > Или применяется супер-технология?
     
      А. И. Вислый (директор по информатизации РГБ) пишет:
      "В настоящий момент электронный фонд Российской государственной библиотеки насчитывает более 10 000 произведений. Однако в 2003 скорость его наполнения будет существенно увеличена за счет:
      1. Увеличения объемов оцифровки на собственной базе и по договорам с другими организациями 6000 документов (книг) за год.
      2. Поиска полных текстов книг, размещенных в Интернет в свободном доступе и копирования их в электронный фонд 5000 документов (книг) за год.
      3. Организации поточного сканирования диссертаций, поступающих в РГБ 25000 диссертаций в год.
      Такой объем новых поступлений (порядка 35 000) сравним с объемом книжной продукции России за год (порядка 50 000 60 000) и требует новых технологических и организационных решений, ведущих к созданию Национальной электронной библиотеки на базе Российской государственной библиотеки. Важнейшими направлениями работ на 2003г. являются: разработка электронного каталога книг, оцифрованных в России, и его постоянное пополнение, создание списков книг для перспективной оцифровки, разработка технологии доступа читателей к полным текстам в условиях отсутствия высокоскоростных каналов в регионах России, разработка нормативных документов, обеспечивающих функционирование Национальной электронной библиотеки".
     
      Так что 1 миллион единиц хранения - это ошибка пресс-релиза.


210. Metrodor, (metrodor@rambler.ru) 10:00:44 [ответить]
      > 209. InFAiR.
      > > 208. Metrodor.
      >
      > Что-то не сходится в расчетах.
      >
      > Допустим, 2,5 выделили и еще по 0,5 ежегодно в течение 10 лет всего 7,5.
      > В средней книге 300 стр. (296, точнее); 1 млн. книг это 300 млн. стр.
      > 7 500 000$/ 300 000 000 стр. = 0,025 цента.
      > Такую себестоимость
      > (с учетом амортизации, производительности и ресурса техники)
      > (без учета оплаты труда, эл. энергии, хранения и т.п.)
      > никакая техника не даст.
      >
      > М.б. я неправильно понял термин ╚единица хранения╩?
      > Или применяется супер-технология?
      >
      > А еще мне понравилось выражение
      > ╚жемчужины╩ интернетского ╚информационного мусора╩


209. InFAiR, Уфа (infair@rusoil.net) 09:31:59 [ответить]
      > 208. Metrodor.
     
      Что-то не сходится в расчетах.
     
      Допустим, 2,5 выделили и еще по 0,5 ежегодно в течение 10 лет всего 7,5.
      В средней книге 300 стр. (296, точнее); 1 млн. книг это 300 млн. стр.
      7 500 000$/ 300 000 000 стр. = 0,025 цента.
      Такую себестоимость
      (с учетом амортизации, производительности и ресурса техники)
      (без учета оплаты труда, эл. энергии, хранения и т.п.)
      никакая техника не даст.
     
      М.б. я неправильно понял термин ╚единица хранения╩?
      Или применяется супер-технология?
     
      А еще мне понравилось выражение
      ╚жемчужины╩ интернетского ╚информационного мусора╩


208. Metrodor, (metrodor@rambler.ru) 07:54:31 [ответить]
      Национальная электронная библиотека
     
      К концу 2003 года откроется интернет-доступ в первую в России крупномасштабную национальную электронную библиотеку. Первым архивом, который можно будет посетить, не выходя из дома, станет диссертационный. Создание электронного информационного хранилища таких масштабов проводится в России впервые, хотя в интернет-пространстве уже функционируют шесть сайтов информационных коллекций. "Главным отличием будущей библиотеки, - пояснил начальник отдела библиотек министерства культуры РФ Евгений Кузьмин, - является широчайший охват всех направлений литературы". В отличие, например, от электронной библиотеки "Кирилла и Мефодия", которая специализируется на справочной литературе, национальное хранилище комплектуется из справочной, научно-популярной, учебной, художественной литературы, собрания научных диссертаций и даже некоторых "жемчужин" интернетного "информационного мусора". В новой библиотеке будет более миллиона единиц хранения. Пополняться она будет, в первую очередь, за счет фондов Российской государственной библиотеки. Кроме того, привлекаются материалы из других крупных библиотек Москвы, а также архива президента РФ. Все материалы будут "оцифровывать", комплектовать, каталогизировать и отправлять в электронное хранилище. Национальная библиотека планирует также заимствовать "оцифрованные" материалы из уже существующих хранилищ. Несмотря на огромную стоимость проекта (только первый вклад составил более 2,5 миллиона долларов, а ежегодные вложения запланированы на уровне не менее 500 тысяч долларов), доступ к библиотечной информации, скорее всего, будет бесплатным. При этом не исключается и создание платных рубрик, к примеру, редких книг или источников, "оцифрованных" на внебюджетные средства.
     
      Оригинал на http://www.mincultrf.ru/news.php?news_id=457>http://www.mincultrf.ru/news.php?news_id=457


Continue