Please use this identifier to cite or link to this item: http://earchive.tpu.ru/handle/11683/5068
Title: Улучшение качества метода оптического распознавания текстов с помощью совместного применения вейвлет-преобразований, курвлет-преобразований и алгоритмов словарного поиска
Other Titles: Improving the quality of optical character recognition method by joint application of wavelet- and curvelet-transforms and vocabulary search algorithm
Authors: Григорьев, Дмитрий Сергеевич
Хаустов, Павел Александрович
Спицын, Владимир Григорьевич
Keywords: вейвлет-преобразования; пороговые преобразования; курвлет-преобразования; динамическое программирование; префиксное дерево; словарный поиск; thresholding; wavelet-transform; curvelet-transform; dynamic programming; trie-tree; vocabulary search
Issue Date: 2013
Publisher: Томский политехнический университет
Citation: Григорьев Д. С. Улучшение качества метода оптического распознавания текстов с помощью совместного применения вейвлет-преобразований, курвлет-преобразований и алгоритмов словарного поиска / Д. С. Григорьев, П. А. Хаустов, В. Г. Спицын // Известия Томского политехнического университета [Известия ТПУ]. — 2013. — Т. 323, № 5 : Управление, вычислительная техника и информатика. — [С. 106-111].
Abstract: Оптическое распознавание символов является комплексной задачей, для решения которой не существует определенного алгоритма. Существует множество подходов и методов для решения данной задачи. Предложенный ранее метод, основанный на совместном применении вейвлет-преобразования для сокращения размерности пространства признаков и вероятностной нейронной сети для классификации, показал приемлемые результаты. Однако предложенный метод может быть дополнен и улучшен алгоритмами предварительной и пост­обработки. Предложен метод предобработки отсканированных изображений на основе адаптивного порогового преобразования в алгоритмах дискретных вейвлет и курвлет-преобразований. Проведены численные эксперименты по выявлению наиболее результативного алгоритма для предобработки. В качестве алгоритма пост­обработки предложен метод улучшения качества распознавания текста на основе алгоритма словарного поиска с использованием динамического программирования.
Optical character recognition is a complex problem, which has no definite solution. There are a lot of approaches and methods to solve this problem. The proposed approach, based on aggregate usage of wavelet-transformation for reducing the feature space and probabilistic neural network for classification, has shown a good quality of recognition. However the proposed approach can be improved with preprocessing and postprocessing algorithms. The algorithm of preprocessing based on adaptive thresholding for curvelet and wavelet transformations is proposed. The numerical experiments are held to determine the most efficient algorithm of preprocessing. The approach based on vocabulary search and dynamic programming is proposed for postprocessing.
URI: http://earchive.tpu.ru/handle/11683/5068
ISSN: 1684-8519
Appears in Collections:Известия Томского политехнического университета. Инжиниринг георесурсов

Files in This Item:
File Description SizeFormat 
bulletin_tpu-2013-323-5-18.pdf216,67 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.