На данной странице Вы можете получить информацию о общей истории развития VintaSoft OCR .NET Plug-in.
Информация о изменениях в API SDK находится в документации.
Используемый движок Tesseract OCR обновлен до версии 5.5.0.
Сборка Vintasoft.Imaging.Ocr.ML теперь использует Microsoft.ML 4.0.0.
Демо приложения:
Веб демо-приложения "OCR Demo" теперь позволяет распознать текст сразу во всех загруженных изображениях, сохранить результат распознавания текста в searchable PDF-документ и отобразить созданный searchable PDF-документ с возможностью выделения и поиска текста.
Добавлена поддержка .NET 8.0 в Windows, Linux и macOS.
Используемый движок Tesseract OCR обновлен до версии 5.3.3.
Теперь все текстовые блоки, которые получены от команды сегментации изображения, помечаются как блоки типа RecognizeSingleColumn. Раньше блоки помечались как блоки RecognizeSingleBlock. Данное изменение увеличило качество распознавания для сложного текста и не снизило общую производительность распознавания текста.
Добавлена поддержка совместимости с Visual Studio 2022.
Поддерживаемые ОС:
Добавлена поддержка совместимости с OS Windows 11.
Прекращена поддержка совместимости с ОС Windows Server 2003.
Используемый движок Tesseract OCR обновлен до версии 5.0. Наши тесты показали, что Tesseract OCR 5 и Tesseract OCR 4 обеспечивают приблизительно одинаковые результаты распознавания текста, но Tesseract OCR 5 до 2-х раз быстрее, чем Tesseract OCR 4.
Добавлена возможность сконвертировать объект OcrPage в объект TextRegion (методы OcrDocument.Create и OcrPage.Create).
Демо-приложения:
Добавлен новый функционал в демо-приложение "OCR Demo":
Добавлена возможность загрузки OCR результатов из текста PDF документа.
Исправлено несколько мелких ошибок.
Веб разработка:
Демо-приложения:
Улучшен код демо-приложения "ASP.NET OCR Demo" ("ASP.NET Core Angular OCR Demo", "ASP.NET MVC OCR Demo", "ASP.NET WebForms OCR Demo") и теперь демо-приложение позволяет:
просматривать документ перед распознаванием текста
обрабатывать страницы документа перед распознаванием текста
распознавать текст во всем документе, отдельной странице или регионе страницы.
Исправлено несколько мелких ошибок в веб сервисе OCR.
Используемый движок Tesseract OCR обновлен до версии 4.0:
Улучшена производительность и качество распознавания текста.
Добавлена поддержка распознавания новых языков.
Добавлена возможность распознавать текст сразу на нескольких языках с помощью функционала Tesseract OCR. Ранее можно было распознавать текст сразу на нескольких языках с помощью функционала SDK.
В демо-приложении "OCR Demo" добавлена возможность выбора нескольких языков для распознавания текста.
Добавлена возможность указывать ортогональный угол поворота текстового региона перед распознаванием текста. Ранее весь текст распознавался как не повернутый.