Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://earchive.tpu.ru/handle/11683/71805
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.advisor | Ботыгин, Игорь Александрович | ru |
dc.contributor.author | Лю, Илэ | ru |
dc.date.accessioned | 2022-06-16T12:47:07Z | - |
dc.date.available | 2022-06-16T12:47:07Z | - |
dc.date.issued | 2022 | - |
dc.identifier.citation | Лю, Илэ. Intelligent voice transcription based on iFLYTEK WEBAPI (Интеллектуальная транскрипция голоса на основе платформы iFLYTEK WEBAPI) : магистерская диссертация / Лю, Илэ ; Национальный исследовательский Томский политехнический университет (ТПУ), Инженерная школа информационных технологий и робототехники (ИШИТР), Отделение информационных технологий (ОИТ) ; науч. рук. И. А. Ботыгин. — Томск, 2022. | - |
dc.identifier.uri | http://earchive.tpu.ru/handle/11683/71805 | - |
dc.description.abstract | Эта работа посвящена проектированию и разработке полного интеллектуального алгоритма транскрипции речи на основе API iFLYTEK.В дополнение к базовому приложению интеллектуального распознавания речи и преобразования текста мы добавили новую функцию синтеза речи. Используется в различных случаях, когда требуется интеллектуальная транскрипция и слияние речи. В исследовании предложена сквозная модель синтеза речи, на этапе обучения модели обучается авторегрессионная сквозная модель, для повышения качества - неавторегрессивная сквозная модель. вводится для эффективного повышения точности распознавания. | ru |
dc.description.abstract | This paper is dedicated to designing and developing a total intelligent speech transcription algorithm based on iFLYTEK API, which can realize the basic application of basic intelligent speech recognition and text conversion, and we have added a new function of speech synthesis. Used in a variety of occasions requiring intelligent speech transcription and fusion. In the research, an end-to-end speech synthesis model is proposed. In the model training stage, the autoregressive end-to-end model is trained. In order to improve the quality, a non-autoregressive end-to-end model is introduced to effectively improve the recognition accuracy. | en |
dc.format.mimetype | application/pdf | - |
dc.language.iso | ru | en |
dc.rights | info:eu-repo/semantics/openAccess | - |
dc.subject | транскрипция голоса | ru |
dc.subject | авторегрессионные сквозные модели | ru |
dc.subject | генерация нетекстовой речи | ru |
dc.subject | неавторегрессионные сквозные модели | ru |
dc.subject | распознавание речи | ru |
dc.subject | voice transcription | en |
dc.subject | autoregressive and non-autoregressive end-to-end models | en |
dc.subject | non-text speech generation | en |
dc.subject | iFlytek | en |
dc.subject | speech recognition | en |
dc.title | Intelligent voice transcription based on iFLYTEK WEBAPI (Интеллектуальная транскрипция голоса на основе платформы iFLYTEK WEBAPI) | ru |
dc.type | Students work | - |
local.department | Национальный исследовательский Томский политехнический университет (ТПУ)::Инженерная школа информационных технологий и робототехники (ИШИТР)::Отделение информационных технологий (ОИТ) | - |
local.institut | 7950 | - |
local.localtype | Студенческая работа | - |
dc.subject.oksvnk | 09.04.01 | - |
local.thesis.level | Магистр | ru |
local.thesis.discipline | Информатика и вычислительная техника | - |
local.local-vkr-id | 1182249 | - |
local.vkr-id | 49912 | - |
local.stud-group | 8ВМ03 | - |
local.lichnost-id | 176985 | - |
local.thesis.level-id | 3 | - |
local.tutor-lichnost-id | 56456 | - |
dc.subject.udc | 004.934.8'1 | - |
Располагается в коллекциях: | Магистерские диссертации |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
TPU1369692.pdf | 2,53 MB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.