Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://earchive.tpu.ru/handle/11683/61334
Название: Алгоритм обнаружения речевой активности в акустическом сигнале с применением сверточных нейронных сетей
Авторы: Тепляков, Андрей Борисович
Научный руководитель: Спицын, Владимир Григорьевич
Ключевые слова: автоматическая обработка речи; обнаружение речевой активности; машинное обучение; глубокое обучение; сверточные нейронные сети; automatic speech recognition; voice activity detection; machine learning; deep learning; convolutional neural network
Дата публикации: 2020
Библиографическое описание: Тепляков А. Б. Алгоритм обнаружения речевой активности в акустическом сигнале с применением сверточных нейронных сетей : магистерская диссертация / А. Б. Тепляков ; Национальный исследовательский Томский политехнический университет (ТПУ), Инженерная школа информационных технологий и робототехники (ИШИТР), Отделение информационных технологий (ОИТ) ; науч. рук. В. Г. Спицын. — Томск, 2020.
Аннотация: Существуют различные варианты применения технологий обработки речевого сигнала, такие как голосовой пользовательский интерфейс или усиление речевого сигнала для людей с нарушениями слуха. Однако разработанные алгоритмы сталкиваются с общей проблемой: необходимо обнаружить присутствие речи в акустическом сигнале, который зачастую искажен шумом. В данной работе рассматривается алгоритм обнаружения голосовой активности во входном акустическом сигнале для отделения активной речи от фонового шума или тишины с помощью сверточной нейронной сети.
There are various applications for automatic speech recognition technologies, such as a voice user interface or speech amplification for people with hearing loss. However, the algorithms face a common problem: it is necessary to detect the presence of speech in an acoustic signal, which is often distorted by noise. This paper considers an algorithm for detecting voice activity in the input acoustic signal to separate human speech from background noise or silence using a convolutional neural network.
URI: http://earchive.tpu.ru/handle/11683/61334
Располагается в коллекциях:Магистерские диссертации

Файлы этого ресурса:
Файл Описание РазмерФормат 
TPU937800.pdf2,49 MBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.