Это не официальный сайт wikipedia.org 01.01.2023

OCRopus — Википедия

OCRopus

OCRopus — OCR-система для распознавания текстов на базе tesseract. Использует код для языка моделирования из проекта OpenFST, поддерживаемого Google. Доступна FreeBSD, Linux, Mac OS X.

OCRopus
Скриншот программы OCRopus
Тип Оптическое распознавание символов
Разработчик Thomas Breuel, DFKI
Написана на C++ и Python
Операционная система FreeBSD, Linux, macOS и Windows 10
Первый выпуск 9 апреля 2007
Последняя версия
Создаваемые форматы файлов HOCR
Лицензия Apache License v2.0
Сайт github.com/tmbdev…​ (англ.)
github.com/ocropu…​ (англ.)
Логотип Викисклада Медиафайлы на Викискладе

ИспользованиеПравить

В настоящее время OCRopus использует только интерфейс командной строки, принимая на вход изображения с текстом, и выводя данные в формате hOCR (открытый формат на основе HTML). Опции командной строки позволяют выполнять отдельно конкретные операции (например, распознание одной строки).

История развитияПравить

  • 0.1.0 alpha — 22 октября 2007
  • 0.1.1 alpha – 14 декабря 2007 - Улучшенная система сборки
  • 0.2 alpha 2 — 31 мая 2008
  • 0.3 alpha 3 – 16 октябрь 2008
  • pre-0.4 alpha 4 – май 2009
  • 0.4.3 – июль 2009
  • 0.4.4 – март 2010
  • 0.5 – июнь 2012
  • 0.6 23 – август 2012
  • 0.7 6 – апрель 2013
  • 1.0 - ноябрь 2014

См. такжеПравить

ПримечанияПравить

  1. Release 1.3.3 — 2017.
  2. Release 1.3.3 — 2017.

СсылкиПравить