ocr was not successful / Ocr running error in Office 2007
Квест с OCR продолжился после установки библиотеки.
Референс добавился и я был уже рад, потирая руки. Но не тут то было.
Первый же запуск кода закончился эксепшеном "Ocr running error".
Начал гуглить... Подтолкнули на попробывать распознать текст самой офисной тулзой "Microsoft Office Document Imaging". Оказалось и в ней не работает. Выдает такую ошибку: "OCR was not successful (no text was found) on one or more pages".
Я начал уже качать сервис паки для офиса. Как на форуме нашел такой совет: сохранить в чернобелом формате. Распозналось. Буду пробывать дальше.
Продолжение: работает еще лучше, если в MODI.Document.Create() передавать не tiff, а сразу jpg!!
Тутже отпишу про скорость работы.
По скорости так себе. Мне конечно несчем сравнить, но скорость не впечатлила.
На моем ноуте C2D 2Ghz оцифровка jpg из слова на одной строчке + цифра на второй происходит за 400-450 мс. если такие картинки сложить в многостраничный tiff, то получается в среднем по 100-120мс на следующую штуку.
Т.е. 6 штук оцифровываются за 1.2с.
В целом меня устроит, но я ожидал более шустрой работы. Но самое обидное - отсутствие возможности передавать мемори стрим. Все только через файлы :(.
Референс добавился и я был уже рад, потирая руки. Но не тут то было.
Первый же запуск кода закончился эксепшеном "Ocr running error".
Начал гуглить... Подтолкнули на попробывать распознать текст самой офисной тулзой "Microsoft Office Document Imaging". Оказалось и в ней не работает. Выдает такую ошибку: "OCR was not successful (no text was found) on one or more pages".
Я начал уже качать сервис паки для офиса. Как на форуме нашел такой совет: сохранить в чернобелом формате. Распозналось. Буду пробывать дальше.
Продолжение: работает еще лучше, если в MODI.Document.Create() передавать не tiff, а сразу jpg!!
Тутже отпишу про скорость работы.
По скорости так себе. Мне конечно несчем сравнить, но скорость не впечатлила.
На моем ноуте C2D 2Ghz оцифровка jpg из слова на одной строчке + цифра на второй происходит за 400-450 мс. если такие картинки сложить в многостраничный tiff, то получается в среднем по 100-120мс на следующую штуку.
Т.е. 6 штук оцифровываются за 1.2с.
В целом меня устроит, но я ожидал более шустрой работы. Но самое обидное - отсутствие возможности передавать мемори стрим. Все только через файлы :(.
0 Comments:
Post a Comment
<< Home