OCR: Как использовать OCR результат от другого OCR движка?
В этом разделе
Если у вас есть OCR результат в формате hOCR, вы можете импортировать результат hOCR - прочитайте, как это сделать
здесь
.
Если у вас нет OCR результата в формате hOCR, вы можете создать OCR результат программно. Для этого вам необходимо выполнить следующие шаги:
- Создать OCR документ (экземпляр класса OcrDocument)
-
Для каждой распознанной страницы:
- Создать OCR страницу (экземпляр класса OcrPage) и добавить созданную страницу в коллекцию страниц (свойство OcrDocument.Pages) OCR документа.
-
Для каждого региона, распознанного на странице:
- Создать OCR регион (экземпляр класса OcrTextRegion) и добавить созданный регион в коллекцию регионов (свойство OcrPage.Regions) OCR страницы.
-
Для каждого абзаца, распознанного в регионе:
- Создать OCR абзац (экземпляр класса OcrParagraph) и добавить созданный абзац в коллекцию абзацев (свойство OcrTextRegion.Paragraphs) OCR региона.
-
Для каждой текстовой строки, которая распознана в абзаце:
- Создать текстовую строку OCR (экземпляр класса OcrTextLine) и добавить созданную текстовую строку в коллекцию текстовых строк (свойство OcrParagraph.TextLines) OCR параграфа.
-
Для каждого слова, распознанного в текстовой строке:
- Создать OCR слово (экземпляр класса OcrWord) и добавить созданное слово в коллекцию слов (свойство OcrTextLine.Words) текстовой строки OCR.
-
Для каждого текстового символа, распознанного в слове:
- Создать текстовый символ OCR (экземпляр класса OcrSymbol) и добавить созданный текстовый символ в коллекцию текстовых символов (свойство OcrWord.Symbols) OCR слова.