Please use this identifier to cite or link to this item: http://earchive.tpu.ru/handle/11683/66296
Title: Разработка нейросетевого алгоритма распознавания надписей на изображениях реальных сцен
Authors: Лобанова, Виктория Александровна
metadata.dc.contributor.advisor: Иванова, Юлия Александровна
Keywords: разработка; свёрточная нейронная сеть; машинное обучение; обработка изображений; текстовые области; development; convolutional neural network; machine learning; image processing; text areas
Issue Date: 2021
Citation: Лобанова В. А. Разработка нейросетевого алгоритма распознавания надписей на изображениях реальных сцен : магистерская диссертация / В. А. Лобанова ; Национальный исследовательский Томский политехнический университет (ТПУ), Инженерная школа информационных технологий и робототехники (ИШИТР), Отделение информационных технологий (ОИТ) ; науч. рук. Ю. А. Иванова. — Томск, 2021.
Abstract: Объектом проектирования и разработки является нейросетевой алгоритм распознавания надписей на изображениях реальных сцен. В процессе исследования был проведён анализ существующих моделей обнаружения текстовых областей на изображениях реальных сцен, на основании которого был произведён выбор модели для дальнейшей реализации. В результате был предложен нейросетевой алгоритм распознавания надписей на изображениях реальных сцен. В ходе проведения тестирования были подобраны такие параметры нейронной сети как размеры входных изображений, количество и типы используемых слоёв. В результате конечного обучения нейросетевого алгоритма удалось добиться высокой точности.
The object of design and development is a neural network algorithm for text recognition on images of real scenes. In the process of researching analytical reviews of existing methods for detecting text areas on images of real scenes were conducted. A model for implementation was chosen. As a result, a neural network algorithm for text recognition on images of real scenes was proposed. As a stage for the selection of the neural network parameters, such parameters as the size of the input images, the number and types of layers used were changed. High accuracy was achieved during the training part.
URI: http://earchive.tpu.ru/handle/11683/66296
Appears in Collections:Магистерские диссертации

Files in This Item:
File Description SizeFormat 
TPU1144474.pdf4,64 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.