Аналіз засобів автоматизованого розпізнавання рукописних текстів
Abstract
У роботі проведено аналіз програмного забезпечення з відкритим кодом у сфері розпізнавання
рукописного тексту HTR (Handwritten Text Recognition). Проведено декомпозицію архітектурних підходів, що
лежать в основі популярних бібліотек, від класичних гібридних мереж CRNN (Convolutional Recurrent Neural
Networks) до новітніх трансформерних моделей «Vision Encoder-Decoder». На основі порівняльного аналізу
інструментів Tesseract, EasyOCR, Keras-OCR та TrOCR визначено ключові метрики ефективності, зокрема
«Character Error Rate» (CER) та час інференсу, в контексті обробки кириличних рукописних даних. Окреслено
специфічні виклики, пов’язані з сегментацією курсиву та адаптацією мовних моделей до морфологічних
особливостей української мови.

