OCRopus
Текущая версия страницы пока не проверялась опытными участниками и может значительно отличаться от версии, проверенной 16 сентября 2016 года; проверки требуют 2 правки.
OCRopus — OCR-система для распознавания текстов на базе tesseract. Использует код для языка моделирования из проекта OpenFST, поддерживаемого Google. Доступна FreeBSD, Linux, Mac OS X.
OCRopus | |
---|---|
Тип | Оптическое распознавание символов |
Разработчик | Thomas Breuel, DFKI |
Написана на | C++ и Python |
Операционная система | FreeBSD, Linux, macOS и Windows 10 |
Первый выпуск | 9 апреля 2007 |
Последняя версия |
|
Создаваемые форматы файлов | HOCR |
Лицензия | Apache License v2.0 |
Сайт |
github.com/tmbdev… (англ.) github.com/ocropu… (англ.) |
Медиафайлы на Викискладе |
ИспользованиеПравить
В настоящее время OCRopus использует только интерфейс командной строки, принимая на вход изображения с текстом, и выводя данные в формате hOCR (открытый формат на основе HTML). Опции командной строки позволяют выполнять отдельно конкретные операции (например, распознание одной строки).
История развитияПравить
- 0.1.0 alpha — 22 октября 2007
- 0.1.1 alpha – 14 декабря 2007 - Улучшенная система сборки
- 0.2 alpha 2 — 31 мая 2008
- 0.3 alpha 3 – 16 октябрь 2008
- pre-0.4 alpha 4 – май 2009
- 0.4.3 – июль 2009
- 0.4.4 – март 2010
- 0.5 – июнь 2012
- 0.6 23 – август 2012
- 0.7 6 – апрель 2013
- 1.0 - ноябрь 2014
См. такжеПравить
ПримечанияПравить
- ↑ Release 1.3.3 — 2017.
- ↑ Release 1.3.3 — 2017.
СсылкиПравить
- OCRopus (официальная страница на Google Code)
- IUPR Publication Server (описание алгоритмов, используемых в OCRopus)
- OpenFST Официальный сайт