uForum.uz

uForum.uz (https://uforum.uz/index.php)
-   Софт (https://uforum.uz/forumdisplay.php?f=421)
-   -   Сканирование и распознование текстов ... бесплатно (https://uforum.uz/showthread.php?t=3492)

Ахадбек Далимов 15.12.2007 20:32

Сканирование и распознование текстов ... бесплатно
 
Прочитал на PC.UZ - думаю вам тоже будет интересно, теперь OCR от Cognitive можно скачать и пользовать бесплатно :)
полнстью здесь(там и ссылка на закачку):
http://www.pc.uz/documents/text/4279.html
:187:

Azamat Davletmuratov 15.12.2007 22:08

Finereader рулит! Хотя кому как :)...

Evgeniy Sklyarevskiy 15.12.2007 23:32

В стандартный офис от МС входит программа Office Imaging распознавания текста - с русским языком работает хорошо (в 2003 во всяком случае, 2007 не пробовал)

Azamat Davletmuratov 16.12.2007 01:01

Evgeniy Sklyarevskiy,
А в Узбекистане не все русское и не все на кириллице ;)

Evgeniy Sklyarevskiy 16.12.2007 11:22

А Файнридер распознает кирилицу с буквами узбекского алфавита? Кто-нибудь пробовал? Там вроде отличия небольшие добавлены в написание символов - но может оказаться критичным.

Про латиницу и так ясно - должен любой OSR распознавать.... Только вот насчет O` не знаю как? И вообще, использование в латинице букв с элементами считаю ошибкой - и так полно букв всяких.

Да, еще - тема называется "распознавание ... бесплатно" а я про офис от МС - он-то не бесплатный, сейчас мы получим по полной программе... поэтому сразу оговорюсь: "используйте лицензионное ПО" не зависимо от того что я думаю по этому поводу :-)

shumbola 16.12.2007 12:11

Цитата:

Сообщение от Evgeniy Sklyarevskiy (Сообщение 62199)
А Файнридер распознает кирилицу с буквами узбекского алфавита? Кто-нибудь пробовал? Там вроде отличия небольшие добавлены в написание символов - но может оказаться критичным.

Конечно распознает. Помню еще в девяносто каком-то году экпериментировал. В поставке finereader не было узбекских паттернов (буквы с крючками), но после обучения сразу стал распозновать.

Думаю любой другой тоже будет распозновать, если обучить.

Anvar Nuriev 16.12.2007 16:47

Проблема всех систем распознавания текстов втом, что они распознают на уровне символов, а не на уровне словаря. Качество страдает но не сильно. После распознавания просто необходимо редактирование на уровне расстановки переносов к примеру.

shumbola 16.12.2007 17:07

Цитата:

Сообщение от Anvar Nuriev (Сообщение 62238)
Проблема всех систем распознавания текстов втом, что они распознают на уровне символов, а не на уровне словаря. Качество страдает но не сильно. После распознавания просто необходимо редактирование на уровне расстановки переносов к примеру.

Разве расстановка переносов не функция редактора? Имели ли ввиду под "на уровне словаря" проверку распознаного текста по словарю?

Anvar Nuriev 16.12.2007 18:15

Цитата:

Сообщение от shumbola (Сообщение 62239)
Цитата:

Сообщение от Anvar Nuriev (Сообщение 62238)
Проблема всех систем распознавания текстов втом, что они распознают на уровне символов, а не на уровне словаря. Качество страдает но не сильно. После распознавания просто необходимо редактирование на уровне расстановки переносов к примеру.

Разве расстановка переносов не функция редактора? Имели ли ввиду под "на уровне словаря" проверку распознаного текста по словарю?

Да так и есть, FineReader узбекскую кирилицу да и латинцу распознает на уровне шрифтов, а вот расставить переносы не может, так как нет словарной базы.

Evgeniy Sklyarevskiy 16.12.2007 18:39

Цитата:

Сообщение от shumbola (Сообщение 62239)
Цитата:

Сообщение от Anvar Nuriev (Сообщение 62238)
Проблема всех систем распознавания текстов втом, что они распознают на уровне символов, а не на уровне словаря. Качество страдает но не сильно. После распознавания просто необходимо редактирование на уровне расстановки переносов к примеру.

Разве расстановка переносов не функция редактора? Имели ли ввиду под "на уровне словаря" проверку распознаного текста по словарю?

Так это уже не к распознаванию а к текстовому процессору вроде Ворда... ой, пардон, тут же о бесплатном разговор, а Ворд - платный...


Текущее время: 19:38. Часовой пояс GMT +5.

Powered by vBulletin® Version 3.8.5
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd. Перевод: zCarot
OOO «Единый интегратор UZINFOCOM»