Tuesday, December 15, 2009

Определить шрифт

Потребовалось определить шрифт, которым написано изображение.
Долго мучился, пока не нашел этот сайт: identifont.com
Результат получился намного лучше чем через WhatTheFont

Labels: ,

Sunday, August 16, 2009

ocr was not successful / Ocr running error in Office 2007

Квест с OCR продолжился после установки библиотеки.
Референс добавился и я был уже рад, потирая руки. Но не тут то было.
Первый же запуск кода закончился эксепшеном "Ocr running error".
Начал гуглить... Подтолкнули на попробывать распознать текст самой офисной тулзой "Microsoft Office Document Imaging". Оказалось и в ней не работает. Выдает такую ошибку: "OCR was not successful (no text was found) on one or more pages".
Я начал уже качать сервис паки для офиса. Как на форуме нашел такой совет: сохранить в чернобелом формате. Распозналось. Буду пробывать дальше.
Продолжение: работает еще лучше, если в MODI.Document.Create() передавать не tiff, а сразу jpg!!

Тутже отпишу про скорость работы.
По скорости так себе. Мне конечно несчем сравнить, но скорость не впечатлила.
На моем ноуте C2D 2Ghz оцифровка jpg из слова на одной строчке + цифра на второй происходит за 400-450 мс. если такие картинки сложить в многостраничный tiff, то получается в среднем по 100-120мс на следующую штуку.
Т.е. 6 штук оцифровываются за 1.2с.

В целом меня устроит, но я ожидал более шустрой работы. Но самое обидное - отсутствие возможности передавать мемори стрим. Все только через файлы :(.

Labels: , , ,

Office 2007 change failed

Захотелось мне попробывать OCR. Как это сделать - описано например тут. Так вот для этого надо в своем проекте добавить референс на Microsoft Office Document Imaging 12.0 Type Library. И эта штука не ставится по дефолту с офисом. Такая вот мелочь стоила мне часа два возни.

Ни change, ни uninstall, ин setup не хотели работать. Change просто сам закрывался, а uninstall завершался сообщением, что он not successfull. Долго пытался накопать решение, как это излечить. Не хотелось использовать такое лобовое решение, как удаление офиса руками (описано тут: http://support.microsoft.com/kb/928218), т.к. не известо было решит ли это мою проблему. Спустя час поиска в инете, я сдался и решил попробывать удалить. Сработало. После ребута все поставилось. Аллилуя!

Labels: , ,