Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://earchive.tpu.ru/handle/11683/39819
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.advisor | Семенов, Михаил Евгеньевич | ru |
dc.contributor.author | Булыгин, Лев Эдуардович | ru |
dc.date.accessioned | 2017-06-09T17:24:43Z | - |
dc.date.available | 2017-06-09T17:24:43Z | - |
dc.date.issued | 2017 | - |
dc.identifier.citation | Булыгин Л. Э. Оценка релевантности текста для географической диверсификации компании : бакалаврская работа / Л. Э. Булыгин ; Национальный исследовательский Томский политехнический университет (ТПУ), Физико-технический институт (ФТИ), Кафедра высшей математики и математической физики (ВММФ) ; науч. рук. М. Е. Семенов. — Томск, 2017. | - |
dc.identifier.uri | http://earchive.tpu.ru/handle/11683/39819 | - |
dc.description.abstract | Машинное обучение эффективно используется для автоматизации решения интеллектуальных задач, что позволяет снизить издержки, сократить объем рутинных операций. Методы проведения исследования: теоретические (изучение литературы, обзор существующих методов и моделей анализа) и практическое применение методов машинного обучения для построения модели. Полученные результаты: Сформулированы критерии релевантности: 1) явное указание, 2) контактная информация, 3) логический вывод из текста 4) логический вывод из числовой информации. С применением различных методов обработки текста: а) TF-IDF, б) word2vec, в) doc2vec построены модели на основе классификаторов: 1) наивный байесовский классификатор, 2) логистическая регрессия, 3) градиентный бустинг над решающими деревьями. | ru |
dc.description.abstract | Machine learning is effectively used to automate the solution of intellectual tasks, which allows you to reduce costs, reduce the amount of routine operations. Research methods: theoretical (study of literature, review of existing methods and models of analysis) and practical application of machine learning methods for building a model. The obtained results: Relevance criteria are formulated: 1) explicit indication, 2) contact information, 3) logical conclusion from the text 4) logical conclusion from the numerical information. Using different methods of text processing: a) TF-IDF, b) word2vec, c) doc2vec models based on classifiers are constructed: 1) naive Bayesian classifier; 2) logistic regression; 3) gradient boosting over deciding trees. | en |
dc.format.mimetype | application/pdf | - |
dc.language.iso | ru | en |
dc.rights | info:eu-repo/semantics/openAccess | - |
dc.subject | машинное обучение | ru |
dc.subject | анализ текста | ru |
dc.subject | географическая диверсификация | ru |
dc.subject | бинарная классификация | ru |
dc.subject | линейный классификатор | ru |
dc.subject | градиентный бустинг | ru |
dc.subject | TF-IDF | ru |
dc.subject | word2vec | ru |
dc.subject | doc2vec | ru |
dc.subject | оптимизация параметров обучения | ru |
dc.subject | Machine learning | en |
dc.subject | text analysis | en |
dc.subject | geographic diversification | en |
dc.subject | binary classification | en |
dc.subject | linear classifier | en |
dc.subject | gradient boosting | en |
dc.subject | TF-IDF | en |
dc.subject | word2vec | en |
dc.subject | doc2vec | en |
dc.subject | optimization of learning parameters | en |
dc.title | Оценка релевантности текста для географической диверсификации компании | ru |
dc.type | Students work | - |
local.department | Национальный исследовательский Томский политехнический университет (ТПУ)::Физико-технический институт (ФТИ)::Кафедра высшей математики и математической физики (ВММФ) | - |
local.institut | 6270 | - |
local.localtype | Студенческая работа | - |
dc.subject.oksvnk | 01.03.02 | - |
local.thesis.level | Бакалавр | ru |
local.thesis.discipline | Прикладная математика и информатика | - |
local.local-vkr-id | 211172 | - |
local.vkr-id | 23597 | - |
local.stud-group | 0В31 | - |
local.lichnost-id | 130856 | - |
local.thesis.level-id | 1 | - |
local.tutor-lichnost-id | 171196 | - |
dc.subject.udc | 005.591.61 | - |
Располагается в коллекциях: | Выпускные квалификационные работы (ВКР) |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
TPU395006.pdf | 2,43 MB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.