Список форумов
|
Добавить сообщение
|
Правила
| 26.11.2024, вторник, 23:21:33
Ответ на сообщение в форуме
"Проблемы OCR и электронных библиотек"
:
Обязательно заполните поле:
Текст сообщения
Обязательно заполните поле:
Ваше имя
Ваше имя:
Город:
Е-Маil:
Сайт:
> [129. InFAiR]. > > [128. Zmiy]. > > > См. тему "А-y! Деpжатели сетевых библиотек!" > > Кажется у Платона, я читал, > что восприятие жизни людьми ассоциируется у него с такой картиной: > где-то в пещере люди прикованы лицом к стене > и о событиях вне стен этой пещеры они судят по теням, > отбрасываемым происходящим вне пещеры, > причем только тем, которые проникают через узкий вход. > > Эта картина немного напоминает рунет, > по части электронных библиотек, в частности, > и обычные, бумажные - в полной мере. > > Попробуйте взглянуть на все со следующей точки зрения. > > Мысли - это камешки, мелкие, крупные, цветные - разные. > Термины - это цемент, незначимые слова - вода. > Пишущие книги - строители, замешивающие растворы, > в результате чего получается кладочный раствор, штукатурка, бетон. > Издатели отливают блоки, из которых составляют пирамиды библиотек. > > Чтобы добраться до необходимой информации, > которая лежит, может на вершине пирамиды, а может в глубине ее > надо иметь механизмы. > Даже отыскав необходимый блок - его надо поднять, осилить интеллектуально. > Затем проникнуть внутрь блока, чтобы отыскать ту необходимую мысль. > > Это все идет от физической природы бумажных библиотек, > которые, как это становится очевидным на данном этапе, > недалеко ушли от каменного века и глиняных, клинописных. > Нельзя изготовить бумажную книгу в 750 тыс. стр., или размером 100х100 м. > В электронном варианте таких ограничений нет, > но многие привязаны к традиционной схеме - > максимум - это электронный каталог-спецификация на пирамиду > или гиперссылки - узкие ходы и коридоры в теле пирамиды. > > Мой взгляд на библиотеку следующий. > > Перевод в электронный вид - это разрушение пирамиды. > Но при этом, структура сохраняется, информация не пропадает, мысли не исчезают. > Мы даже отсканированные изображения держим, > чтобы в любой момент можно было проверить идентичность, > или восстановить блок (книгу) в первозданном виде. > Не исчезли ни песок, ни вода, ни цемент. > Компьютер позволяет мгновенно просеять все и отделить, > не скажу ╚зерна от плевел╩, но, по крайней мере, разделить на фракции, > и, при необходимости, отлить новый блок в новой форме. > Но это побочный эффект. > Основное - с применением различных методов поиска, стало возможным > разделение информации (синтез, надеюсь еще впереди). > > Отсюда и заблуждение в последовательности поиска: > найти полку (раздел) - найти книгу - найти страницу - найти фразу. > В нашей программе вводится слово > (или фраза, или автор, или что хотите) > (как впрочем, и во всех поисковых программах); > Осуществляется ╚сквозной╩, полнотекстовый в настоящем смысле поиск: > программа ╚пролистывает╩ все 2,5 тыс. книг, естественно по индексу. > В результатах поиска - все, и меня не интересует какая книга, кто автор и > т.п., хотя эта информация тоже выводится. > > Для существующих текстовых (txt) электронных библиотек > создать такую программу плевое дело: > надо разбить тексты на блоки, > на каждом поставить штамп изготовителя (автор, название книги) > и время изготовления (стр. ил
Сортировать форумы по возрастанию даты публикации?
(Использовать эту опцию не рекомендуется)