Цитата:
Сообщение от Ibragim Yermatov
Цитата:
Сообщение от Evgeniy Sklyarevskiy
Надо все усилия направить на перевод текстов в цифру - и потом уже делать нормальный поиск по текстам интеллектуальный.
|
Важно, чтобы при переводе текста в цифру сделали текст в реальном цифровом формате, не произвели подмену понятий. Формально, отсканированный текст в формате PDF считается оцифрованным текстом, но это картинка текста в цифровом формате. К тому же, часто для ускорения оцифровки и уменьшения веса ресурса делают это с наименьшим разрешением. Такие ресурсы плохо видны, с трудом читаемы, не поддаются рассмотрению при увеличении.
|
Вы точно подметили, сканирование и выкладывание в графических форматах не считается оцифровкой, текст обязательно должен быть распознан и выложен как текст (тут конечно куча проблем с формулами, чертежами, обозначениями и т.д.) - ибо только в этом случае можно построить полноценный интеллектуальный поиск по всем книгам всех библиотек.
Если же выкладывать в графических форматах, то надо снабжать книги и статьи тегами подробными - это требует затрат от специалистов. Тут можно привлечь добровольцев из юзеров Сети.