Please use this identifier to cite or link to this item: http://earchive.tpu.ru/handle/11683/61446
Title: Автоматическая генерация семантически связного текста методами машинного обучения
Authors: Кривошеев, Николай Анатольевич
metadata.dc.contributor.advisor: Спицын, Владимир Григорьевич
Keywords: генерация текста; генеративно-состязательная нейронная сеть; SeqGAN; LSTM; автоэнкодер; предварительная обработка текстовых данных; машинное обучение; text generation; generative adversarial network; SeqGAN; LSTM; autoencoder; text data preprocessing; machine learning
Issue Date: 2020
Citation: Кривошеев Н. А. Автоматическая генерация семантически связного текста методами машинного обучения : магистерская диссертация / Н. А. Кривошеев ; Национальный исследовательский Томский политехнический университет (ТПУ), Инженерная школа информационных технологий и робототехники (ИШИТР), Отделение информационных технологий (ОИТ) ; науч. рук. В. Г. Спицын. — Томск, 2020.
Abstract: Целями данной работы являются: проведение аналитического обзора методов генерации семантически связного текста, реализация алгоритмов машинного обучения для генерации семантически связного текста, проведение сравнения с аналогичными решениями. В результате исследования: был проведен анализ алгоритмов генерации текста. Проведен поиск выборок данных для обучения реализованных алгоритмов. Реализованы: автоэнкодер, два подхода к генерации текста на основе RNN, упрощенная реализация SeqGAN (без реализации алгоритма Монте-Карло). Приведены результаты обучения и тестирования. Проведено обучение и тестирование реализованных алгоритмов и нейронной сети LeakGAN. Проведена оценка качества нейронных сетей LSTM и SeqGAN по метрике BLEU. Проведено сравнение с аналогичными решениями.
The objectives of this work are: to conduct an analytical review of methods for generating a semantically coherent text, implement machine learning algorithms to generate a semantically coherent text, and compare with similar solutions. As a result of the study: an analysis of the text generation algorithms was carried out. A search was made of data samples for training implemented algorithms. Implemented: auto-encoder, two approaches to generating text based on RNN, simplified implementation of SeqGAN (without implementation of the Monte Carlo algorithm). The results of training and testing. Training and testing of implemented algorithms and LeakGAN was conducted. The quality of neural networks LSTM and SeqGAN was assessed using the BLEU metric. Compared with similar solutions.
URI: http://earchive.tpu.ru/handle/11683/61446
Appears in Collections:Магистерские диссертации

Files in This Item:
File SizeFormat 
TPU940643.pdf1,46 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.