Распознавание печатной формы. Оптимальный алгоритм? Добрый день! Задача состоит в распознавании сканированной печатной формы и конвертации её к html виду. На данный момент я применяю tess4j java-форк библиотеки tesseract. Однако, возникла проблема сегментации изображения на подобласти (div регионы) с целью мак. качества распознавания. Существуют ли другие решения, оч. желатательно freeware?

21 Авг 2019 в 06:08
166 +1
0
Ответы
1

Добрый день! Для задачи распознавания печатной формы и конвертации ее в HTML вид существует несколько алгоритмов и инструментов, которые могут помочь вам. Одним из таких инструментов является OpenCV, который предоставляет богатый набор функций для обработки изображений, включая сегментацию и распознавание текста.

Вы можете использовать OpenCV вместе с другими библиотеками, такими как Tesseract, для достижения лучших результатов в распознавании печатной формы. Кроме того, существуют другие бесплатные инструменты, такие как Keras OCR, которые также могут быть полезны для данной задачи.

Учитывая вашу текущую проблему с сегментацией изображения, рекомендуется изучить возможности OpenCV для этой задачи. Вы также можете обратиться к сообществу разработчиков на форумах или в чатах для получения советов и рекомендаций относительно оптимального подхода к решению данной проблемы.

Надеюсь, эта информация будет полезна для вас. Удачи в вашем проекте!

20 Апр 2024 в 13:23
Не можешь разобраться в этой теме?
Обратись за помощью к экспертам
Гарантированные бесплатные доработки в течение 1 года
Быстрое выполнение от 2 часов
Проверка работы на плагиат
Поможем написать учебную работу
Прямой эфир