Please use this identifier to cite or link to this item:
http://earchive.tpu.ru/handle/11683/5068
Title: | Улучшение качества метода оптического распознавания текстов с помощью совместного применения вейвлет-преобразований, курвлет-преобразований и алгоритмов словарного поиска |
Other Titles: | Improving the quality of optical character recognition method by joint application of wavelet- and curvelet-transforms and vocabulary search algorithm |
Authors: | Григорьев, Дмитрий Сергеевич Хаустов, Павел Александрович Спицын, Владимир Григорьевич |
Keywords: | вейвлет-преобразования; пороговые преобразования; курвлет-преобразования; динамическое программирование; префиксное дерево; словарный поиск; thresholding; wavelet-transform; curvelet-transform; dynamic programming; trie-tree; vocabulary search |
Issue Date: | 2013 |
Publisher: | Томский политехнический университет |
Citation: | Григорьев Д. С. Улучшение качества метода оптического распознавания текстов с помощью совместного применения вейвлет-преобразований, курвлет-преобразований и алгоритмов словарного поиска / Д. С. Григорьев, П. А. Хаустов, В. Г. Спицын // Известия Томского политехнического университета [Известия ТПУ]. — 2013. — Т. 323, № 5 : Управление, вычислительная техника и информатика. — [С. 106-111]. |
Abstract: | Оптическое распознавание символов является комплексной задачей, для решения которой не существует определенного алгоритма. Существует множество подходов и методов для решения данной задачи. Предложенный ранее метод, основанный на совместном применении вейвлет-преобразования для сокращения размерности пространства признаков и вероятностной нейронной сети для классификации, показал приемлемые результаты. Однако предложенный метод может быть дополнен и улучшен алгоритмами предварительной и постобработки. Предложен метод предобработки отсканированных изображений на основе адаптивного порогового преобразования в алгоритмах дискретных вейвлет и курвлет-преобразований. Проведены численные эксперименты по выявлению наиболее результативного алгоритма для предобработки. В качестве алгоритма постобработки предложен метод улучшения качества распознавания текста на основе алгоритма словарного поиска с использованием динамического программирования. Optical character recognition is a complex problem, which has no definite solution. There are a lot of approaches and methods to solve this problem. The proposed approach, based on aggregate usage of wavelet-transformation for reducing the feature space and probabilistic neural network for classification, has shown a good quality of recognition. However the proposed approach can be improved with preprocessing and postprocessing algorithms. The algorithm of preprocessing based on adaptive thresholding for curvelet and wavelet transformations is proposed. The numerical experiments are held to determine the most efficient algorithm of preprocessing. The approach based on vocabulary search and dynamic programming is proposed for postprocessing. |
URI: | http://earchive.tpu.ru/handle/11683/5068 |
ISSN: | 1684-8519 |
Appears in Collections: | Известия Томского политехнического университета. Инжиниринг георесурсов |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
bulletin_tpu-2013-323-5-18.pdf | 216,67 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.