PDA

Просмотр полной версии : Сканирование и распознование текстов ... бесплатно


Ахадбек Далимов
15.12.2007, 20:32
Прочитал на PC.UZ - думаю вам тоже будет интересно, теперь OCR от Cognitive можно скачать и пользовать бесплатно :)
полнстью здесь(там и ссылка на закачку):
http://www.pc.uz/documents/text/4279.html
:187:

Azamat Davletmuratov
15.12.2007, 22:08
Finereader рулит! Хотя кому как :)...

Evgeniy Sklyarevskiy
15.12.2007, 23:32
В стандартный офис от МС входит программа Office Imaging распознавания текста - с русским языком работает хорошо (в 2003 во всяком случае, 2007 не пробовал)

Azamat Davletmuratov
16.12.2007, 01:01
Evgeniy Sklyarevskiy,
А в Узбекистане не все русское и не все на кириллице ;)

Evgeniy Sklyarevskiy
16.12.2007, 11:22
А Файнридер распознает кирилицу с буквами узбекского алфавита? Кто-нибудь пробовал? Там вроде отличия небольшие добавлены в написание символов - но может оказаться критичным.

Про латиницу и так ясно - должен любой OSR распознавать.... Только вот насчет O` не знаю как? И вообще, использование в латинице букв с элементами считаю ошибкой - и так полно букв всяких.

Да, еще - тема называется "распознавание ... бесплатно" а я про офис от МС - он-то не бесплатный, сейчас мы получим по полной программе... поэтому сразу оговорюсь: "используйте лицензионное ПО" не зависимо от того что я думаю по этому поводу :-)

shumbola
16.12.2007, 12:11
А Файнридер распознает кирилицу с буквами узбекского алфавита? Кто-нибудь пробовал? Там вроде отличия небольшие добавлены в написание символов - но может оказаться критичным.

Конечно распознает. Помню еще в девяносто каком-то году экпериментировал. В поставке finereader не было узбекских паттернов (буквы с крючками), но после обучения сразу стал распозновать.

Думаю любой другой тоже будет распозновать, если обучить.

Anvar Nuriev
16.12.2007, 16:47
Проблема всех систем распознавания текстов втом, что они распознают на уровне символов, а не на уровне словаря. Качество страдает но не сильно. После распознавания просто необходимо редактирование на уровне расстановки переносов к примеру.

shumbola
16.12.2007, 17:07
Проблема всех систем распознавания текстов втом, что они распознают на уровне символов, а не на уровне словаря. Качество страдает но не сильно. После распознавания просто необходимо редактирование на уровне расстановки переносов к примеру.

Разве расстановка переносов не функция редактора? Имели ли ввиду под "на уровне словаря" проверку распознаного текста по словарю?

Anvar Nuriev
16.12.2007, 18:15
Проблема всех систем распознавания текстов втом, что они распознают на уровне символов, а не на уровне словаря. Качество страдает но не сильно. После распознавания просто необходимо редактирование на уровне расстановки переносов к примеру.

Разве расстановка переносов не функция редактора? Имели ли ввиду под "на уровне словаря" проверку распознаного текста по словарю?

Да так и есть, FineReader узбекскую кирилицу да и латинцу распознает на уровне шрифтов, а вот расставить переносы не может, так как нет словарной базы.

Evgeniy Sklyarevskiy
16.12.2007, 18:39
Проблема всех систем распознавания текстов втом, что они распознают на уровне символов, а не на уровне словаря. Качество страдает но не сильно. После распознавания просто необходимо редактирование на уровне расстановки переносов к примеру.

Разве расстановка переносов не функция редактора? Имели ли ввиду под "на уровне словаря" проверку распознаного текста по словарю?

Так это уже не к распознаванию а к текстовому процессору вроде Ворда... ой, пардон, тут же о бесплатном разговор, а Ворд - платный...

shumbola
16.12.2007, 19:11
Проблема всех систем распознавания текстов втом, что они распознают на уровне символов, а не на уровне словаря. Качество страдает но не сильно. После распознавания просто необходимо редактирование на уровне расстановки переносов к примеру.

Разве расстановка переносов не функция редактора? Имели ли ввиду под "на уровне словаря" проверку распознаного текста по словарю?

Так это уже не к распознаванию а к текстовому процессору вроде Ворда... ой, пардон, тут же о бесплатном разговор, а Ворд - платный...

Вот почему и вопрос у меня возник...