Автоматическая генерация семантически связного текста методами машинного обучения

Кривошеев, Николай Анатольевич

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://earchive.tpu.ru/handle/11683/61446

Название:	Автоматическая генерация семантически связного текста методами машинного обучения
Авторы:	Кривошеев, Николай Анатольевич
Научный руководитель:	Спицын, Владимир Григорьевич
Ключевые слова:	генерация текста; генеративно-состязательная нейронная сеть; SeqGAN; LSTM; автоэнкодер; предварительная обработка текстовых данных; машинное обучение; text generation; generative adversarial network; SeqGAN; LSTM; autoencoder; text data preprocessing; machine learning
Дата публикации:	2020
Библиографическое описание:	Кривошеев Н. А. Автоматическая генерация семантически связного текста методами машинного обучения : магистерская диссертация / Н. А. Кривошеев ; Национальный исследовательский Томский политехнический университет (ТПУ), Инженерная школа информационных технологий и робототехники (ИШИТР), Отделение информационных технологий (ОИТ) ; науч. рук. В. Г. Спицын. — Томск, 2020.
Аннотация:	Целями данной работы являются: проведение аналитического обзора методов генерации семантически связного текста, реализация алгоритмов машинного обучения для генерации семантически связного текста, проведение сравнения с аналогичными решениями. В результате исследования: был проведен анализ алгоритмов генерации текста. Проведен поиск выборок данных для обучения реализованных алгоритмов. Реализованы: автоэнкодер, два подхода к генерации текста на основе RNN, упрощенная реализация SeqGAN (без реализации алгоритма Монте-Карло). Приведены результаты обучения и тестирования. Проведено обучение и тестирование реализованных алгоритмов и нейронной сети LeakGAN. Проведена оценка качества нейронных сетей LSTM и SeqGAN по метрике BLEU. Проведено сравнение с аналогичными решениями. The objectives of this work are: to conduct an analytical review of methods for generating a semantically coherent text, implement machine learning algorithms to generate a semantically coherent text, and compare with similar solutions. As a result of the study: an analysis of the text generation algorithms was carried out. A search was made of data samples for training implemented algorithms. Implemented: auto-encoder, two approaches to generating text based on RNN, simplified implementation of SeqGAN (without implementation of the Monte Carlo algorithm). The results of training and testing. Training and testing of implemented algorithms and LeakGAN was conducted. The quality of neural networks LSTM and SeqGAN was assessed using the BLEU metric. Compared with similar solutions.
URI:	http://earchive.tpu.ru/handle/11683/61446
Располагается в коллекциях:	Магистерские диссертации

Файлы этого ресурса:

Файл	Описание	Размер	Формат
TPU940643.pdf		1,46 MB	Adobe PDF	Просмотреть/Открыть

Показать полное описание ресурса Статистика

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.