Сканирование и распознование текстов ... бесплатно [Архив]

Ахадбек Далимов

15.12.2007, 20:32

Прочитал на PC.UZ - думаю вам тоже будет интересно, теперь OCR от Cognitive можно скачать и пользовать бесплатно :)
полнстью здесь(там и ссылка на закачку):
http://www.pc.uz/documents/text/4279.html
:187:

Azamat Davletmuratov

15.12.2007, 22:08

Finereader рулит! Хотя кому как :)...

Evgeniy Sklyarevskiy

15.12.2007, 23:32

В стандартный офис от МС входит программа Office Imaging распознавания текста - с русским языком работает хорошо (в 2003 во всяком случае, 2007 не пробовал)

Azamat Davletmuratov

16.12.2007, 01:01

Evgeniy Sklyarevskiy,
А в Узбекистане не все русское и не все на кириллице ;)

Evgeniy Sklyarevskiy

16.12.2007, 11:22

А Файнридер распознает кирилицу с буквами узбекского алфавита? Кто-нибудь пробовал? Там вроде отличия небольшие добавлены в написание символов - но может оказаться критичным.

Про латиницу и так ясно - должен любой OSR распознавать.... Только вот насчет O` не знаю как? И вообще, использование в латинице букв с элементами считаю ошибкой - и так полно букв всяких.

Да, еще - тема называется "распознавание ... бесплатно" а я про офис от МС - он-то не бесплатный, сейчас мы получим по полной программе... поэтому сразу оговорюсь: "используйте лицензионное ПО" не зависимо от того что я думаю по этому поводу :-)

shumbola

16.12.2007, 12:11

А Файнридер распознает кирилицу с буквами узбекского алфавита? Кто-нибудь пробовал? Там вроде отличия небольшие добавлены в написание символов - но может оказаться критичным.

Конечно распознает. Помню еще в девяносто каком-то году экпериментировал. В поставке finereader не было узбекских паттернов (буквы с крючками), но после обучения сразу стал распозновать.

Думаю любой другой тоже будет распозновать, если обучить.

Anvar Nuriev

16.12.2007, 16:47

Проблема всех систем распознавания текстов втом, что они распознают на уровне символов, а не на уровне словаря. Качество страдает но не сильно. После распознавания просто необходимо редактирование на уровне расстановки переносов к примеру.

shumbola

16.12.2007, 17:07

Проблема всех систем распознавания текстов втом, что они распознают на уровне символов, а не на уровне словаря. Качество страдает но не сильно. После распознавания просто необходимо редактирование на уровне расстановки переносов к примеру.

Разве расстановка переносов не функция редактора? Имели ли ввиду под "на уровне словаря" проверку распознаного текста по словарю?

Anvar Nuriev

16.12.2007, 18:15

Проблема всех систем распознавания текстов втом, что они распознают на уровне символов, а не на уровне словаря. Качество страдает но не сильно. После распознавания просто необходимо редактирование на уровне расстановки переносов к примеру.

Разве расстановка переносов не функция редактора? Имели ли ввиду под "на уровне словаря" проверку распознаного текста по словарю?

Да так и есть, FineReader узбекскую кирилицу да и латинцу распознает на уровне шрифтов, а вот расставить переносы не может, так как нет словарной базы.

Evgeniy Sklyarevskiy

16.12.2007, 18:39

Проблема всех систем распознавания текстов втом, что они распознают на уровне символов, а не на уровне словаря. Качество страдает но не сильно. После распознавания просто необходимо редактирование на уровне расстановки переносов к примеру.

Разве расстановка переносов не функция редактора? Имели ли ввиду под "на уровне словаря" проверку распознаного текста по словарю?

Так это уже не к распознаванию а к текстовому процессору вроде Ворда... ой, пардон, тут же о бесплатном разговор, а Ворд - платный...

shumbola

16.12.2007, 19:11

Проблема всех систем распознавания текстов втом, что они распознают на уровне символов, а не на уровне словаря. Качество страдает но не сильно. После распознавания просто необходимо редактирование на уровне расстановки переносов к примеру.

Разве расстановка переносов не функция редактора? Имели ли ввиду под "на уровне словаря" проверку распознаного текста по словарю?

Так это уже не к распознаванию а к текстовому процессору вроде Ворда... ой, пардон, тут же о бесплатном разговор, а Ворд - платный...

Вот почему и вопрос у меня возник...