VintaSoft Imaging .NET SDK 14.0: Документация для .NET разработчика
В этом разделе
    OCR: Введение
    В этом разделе
    OCR движок предназначен для распознавания текста на изображении. SDK предоставляет класс OcrEngine, который определяет абстрактный механизм распознавания текста для распознавания одноязычного текста на всем изображении или в его области. Архитектура SDK открыта и позволяет подключить любой OCR движок.

    Начиная с версии 11.0.2.1 SDK включает движок Tesseract OCR версии 5.0. Класс TesseractOcr является производным от класса OcrEngine и позволяет распознавать текст одного языка на всем изображении или в области изображения.

    Процесс распознавания текста состоит из следующих шагов:
    1. Подготовка изображения к распознаванию текста
    2. Подготовка OCR движка к распознаванию текста
    3. Распознавание текста на изображении
    4. Получение и редактирование OCR результатов
    5. Сохранение OCR результата
      1. Сохранение OCR результата в текстовый файл
      2. Сохранение OCR результата в PDF документ с возможностью поиска
      3. Экспорт OCR результата в hOCR-файл