Отсканированный текст уже давно и успешно распознается с помощью OCREADEREADEREADEREADEREADEREADEREADEREADEREADEREADEREADEREADEREADEREADEREADEReadereader систем, таких, как Finereader, но ни разу не встречал подобных программ, умеющих распознаватьматематическиеформулормулормулормулормулормулормулормулормулормулормулормулормулормулормулормулы (а не сохранять их как картинки) с экспортом в equation/tex/хоть куда-нибудь. Может кто знает такие?
Группа: Admin
Сообщений: немеряно
Регистрация: 21.06.03 Авторитет: 100
Вне форума
alexk есть платный скриптец который позволяет сохранять формулы из .xls файла c импортом в .html и потом работать c html как с расчетным листом, используеться для ленивых прайс листов, где покупатель высчитывает стоимость заказа исходя из позиций прайс листа (например), могет и поможет тебе в твоей проблеме, только искать его ... уже не помню где.
____________________
Ничто так не сближает людей, как снайперский прицел
С сайтов _http://www.inftyproject.org/index-e.html _http://www.caisystem.co.jp/infty/e/index.html можно скачать дистрибутивы InftyEditor (архив - около 3 MB) и Infty (архив - около 8 MB). Первый - WYSIWYG-редактор под формат LaTeX. Второй - OCR-пакет, распознающий как текст, так и ы. Ридер - бесплатный, но для закачки требует регистрации на сайте (на мыло присылают пароль). А эдитор регистрации не требует, но он условно-бесплатный, причем trial-период у него - 30 дней. Потом надо платить 55$ за лицензию (после переустановки отсчет trial-периода начинается заново ).
Ридер работает только под Windows 2000 или ХР. На вход надо подать .tiff с разрешением 400 или 600 dpi , но не любой (например, .tiff CCITT GROUP 4 катит, а .tiff LZW-сжатый - нет - но это не проблема - практически любые графические форматы и подформаты, которые нужно, у меня перегоняются друг в друга PMView Pro).
Работает панель рукописного ввода - ты мышкой рисуешь у с корнями, дробями, интегралами, суммами - ридер распознает.
В новой версии распознавателя Infty2.4.2z(11-10-2004) японцы пофиксили некоторые баги.
На хомсайте написано:
People who had trouble with the previous versions, including V2.4.2z uploaded on 30/9/2004, on Windows OS in European languages (French, Germany, etc.) <-- русский сюда же are requested to replace it by the current version of 11/10/2004. Some other bugs cocerning left-subscripts (e.g. Combination expression) are also fixed in the present version.
Теперь окошко с сообщением о Microsoft Visual C++ Runtime Library Runtime Error появляется существенно реже .
У меня получилось довольно пристойно распознать отсканированный математический текст в .tiff GROUP 4 с разрешением 600 dpi и сохранить результат в форматах .IML (это внутренний форматInfty, в котором ы можно WYSIWYG-редактировать) и .HTML (с ами как .PNG-рисунками).
НО: не удалось сохранить результат в форматах .XML и .(La)TeX (вообще, интеграция с ТеХом оставляет желать лучшего). Кроме того, остается проблема с пропадающими символами - какой-то глюк в установке шрифтов Infty. В шрифтах не хватает почему-то именно символов sum (сумма) и infty (бесконечность).
Теперь ждем новой версии WYSIWYG-редактора для TeX InftyEditor. Текущие релиз 2.03с и бэта-версия 2.04(10-9-2004) под русской Windows работать не желают.
Супер! Если бы к этому времени я уже не закончил свой математический факультет - цены бы не было . Но все равно большое спасибо, никогда не знаешь, где может пригодиться
Не успел я отправить предыдущее сообщение, как японцы еще раз пофиксили свою прогу. (Некоторые антивирусники реже обновляются )
На хомсайте написано:
People who had trouble with the previous versions, including V2.4.2z uploaded on 30/9/2004, on Windows OS in European languages (French, Germany, etc.) are requested to replace it by the current version of 13/10/2004. Some other bugs cocerning left-subscripts (e.g. Combination expression) are also fixed in the present version.
В новой версии InftyReader2.4.2z(13-10-2004) уже можно сохранить распознанное как ТеХ (включая формулы). Но проблема со шрифтами осталась. И по-прежнему нет интеграции с имеющимся MiKTeXом.