Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://earchive.tpu.ru/handle/11683/71805
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorБотыгин, Игорь Александровичru
dc.contributor.authorЛю, Илэru
dc.date.accessioned2022-06-16T12:47:07Z-
dc.date.available2022-06-16T12:47:07Z-
dc.date.issued2022-
dc.identifier.citationЛю, Илэ. Intelligent voice transcription based on iFLYTEK WEBAPI (Интеллектуальная транскрипция голоса на основе платформы iFLYTEK WEBAPI) : магистерская диссертация / Лю, Илэ ; Национальный исследовательский Томский политехнический университет (ТПУ), Инженерная школа информационных технологий и робототехники (ИШИТР), Отделение информационных технологий (ОИТ) ; науч. рук. И. А. Ботыгин. — Томск, 2022.-
dc.identifier.urihttp://earchive.tpu.ru/handle/11683/71805-
dc.description.abstractЭта работа посвящена проектированию и разработке полного интеллектуального алгоритма транскрипции речи на основе API iFLYTEK.В дополнение к базовому приложению интеллектуального распознавания речи и преобразования текста мы добавили новую функцию синтеза речи. Используется в различных случаях, когда требуется интеллектуальная транскрипция и слияние речи. В исследовании предложена сквозная модель синтеза речи, на этапе обучения модели обучается авторегрессионная сквозная модель, для повышения качества - неавторегрессивная сквозная модель. вводится для эффективного повышения точности распознавания.ru
dc.description.abstractThis paper is dedicated to designing and developing a total intelligent speech transcription algorithm based on iFLYTEK API, which can realize the basic application of basic intelligent speech recognition and text conversion, and we have added a new function of speech synthesis. Used in a variety of occasions requiring intelligent speech transcription and fusion. In the research, an end-to-end speech synthesis model is proposed. In the model training stage, the autoregressive end-to-end model is trained. In order to improve the quality, a non-autoregressive end-to-end model is introduced to effectively improve the recognition accuracy.en
dc.format.mimetypeapplication/pdf-
dc.language.isoruen
dc.rightsinfo:eu-repo/semantics/openAccess-
dc.subjectтранскрипция голосаru
dc.subjectавторегрессионные сквозные моделиru
dc.subjectгенерация нетекстовой речиru
dc.subjectнеавторегрессионные сквозные моделиru
dc.subjectраспознавание речиru
dc.subjectvoice transcriptionen
dc.subjectautoregressive and non-autoregressive end-to-end modelsen
dc.subjectnon-text speech generationen
dc.subjectiFlyteken
dc.subjectspeech recognitionen
dc.titleIntelligent voice transcription based on iFLYTEK WEBAPI (Интеллектуальная транскрипция голоса на основе платформы iFLYTEK WEBAPI)ru
dc.typeStudents work-
local.departmentНациональный исследовательский Томский политехнический университет (ТПУ)::Инженерная школа информационных технологий и робототехники (ИШИТР)::Отделение информационных технологий (ОИТ)-
local.institut7950-
local.localtypeСтуденческая работа-
dc.subject.oksvnk09.04.01-
local.thesis.levelМагистрru
local.thesis.disciplineИнформатика и вычислительная техника-
local.local-vkr-id1182249-
local.vkr-id49912-
local.stud-group8ВМ03-
local.lichnost-id176985-
local.thesis.level-id3-
local.tutor-lichnost-id56456-
dc.subject.udc004.934.8'1-
Располагается в коллекциях:Магистерские диссертации

Файлы этого ресурса:
Файл Описание РазмерФормат 
TPU1369692.pdf2,53 MBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.