Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://earchive.tpu.ru/handle/11683/39819
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorСеменов, Михаил Евгеньевичru
dc.contributor.authorБулыгин, Лев Эдуардовичru
dc.date.accessioned2017-06-09T17:24:43Z-
dc.date.available2017-06-09T17:24:43Z-
dc.date.issued2017-
dc.identifier.citationБулыгин Л. Э. Оценка релевантности текста для географической диверсификации компании : бакалаврская работа / Л. Э. Булыгин ; Национальный исследовательский Томский политехнический университет (ТПУ), Физико-технический институт (ФТИ), Кафедра высшей математики и математической физики (ВММФ) ; науч. рук. М. Е. Семенов. — Томск, 2017.-
dc.identifier.urihttp://earchive.tpu.ru/handle/11683/39819-
dc.description.abstractМашинное обучение эффективно используется для автоматизации решения интеллектуальных задач, что позволяет снизить издержки, сократить объем рутинных операций. Методы проведения исследования: теоретические (изучение литературы, обзор существующих методов и моделей анализа) и практическое применение методов машинного обучения для построения модели. Полученные результаты: Сформулированы критерии релевантности: 1) явное указание, 2) контактная информация, 3) логический вывод из текста 4) логический вывод из числовой информации. С применением различных методов обработки текста: а) TF-IDF, б) word2vec, в) doc2vec построены модели на основе классификаторов: 1) наивный байесовский классификатор, 2) логистическая регрессия, 3) градиентный бустинг над решающими деревьями.ru
dc.description.abstractMachine learning is effectively used to automate the solution of intellectual tasks, which allows you to reduce costs, reduce the amount of routine operations. Research methods: theoretical (study of literature, review of existing methods and models of analysis) and practical application of machine learning methods for building a model. The obtained results: Relevance criteria are formulated: 1) explicit indication, 2) contact information, 3) logical conclusion from the text 4) logical conclusion from the numerical information. Using different methods of text processing: a) TF-IDF, b) word2vec, c) doc2vec models based on classifiers are constructed: 1) naive Bayesian classifier; 2) logistic regression; 3) gradient boosting over deciding trees.en
dc.format.mimetypeapplication/pdf-
dc.language.isoruen
dc.rightsinfo:eu-repo/semantics/openAccess-
dc.subjectмашинное обучениеru
dc.subjectанализ текстаru
dc.subjectгеографическая диверсификацияru
dc.subjectбинарная классификацияru
dc.subjectлинейный классификаторru
dc.subjectградиентный бустингru
dc.subjectTF-IDFru
dc.subjectword2vecru
dc.subjectdoc2vecru
dc.subjectоптимизация параметров обученияru
dc.subjectMachine learningen
dc.subjecttext analysisen
dc.subjectgeographic diversificationen
dc.subjectbinary classificationen
dc.subjectlinear classifieren
dc.subjectgradient boostingen
dc.subjectTF-IDFen
dc.subjectword2vecen
dc.subjectdoc2vecen
dc.subjectoptimization of learning parametersen
dc.titleОценка релевантности текста для географической диверсификации компанииru
dc.typeStudents work-
local.departmentНациональный исследовательский Томский политехнический университет (ТПУ)::Физико-технический институт (ФТИ)::Кафедра высшей математики и математической физики (ВММФ)-
local.institut6270-
local.localtypeСтуденческая работа-
dc.subject.oksvnk01.03.02-
local.thesis.levelБакалаврru
local.thesis.disciplineПрикладная математика и информатика-
local.local-vkr-id211172-
local.vkr-id23597-
local.stud-group0В31-
local.lichnost-id130856-
local.thesis.level-id1-
local.tutor-lichnost-id171196-
dc.subject.udc005.591.61-
Располагается в коллекциях:Выпускные квалификационные работы (ВКР)

Файлы этого ресурса:
Файл Описание РазмерФормат 
TPU395006.pdf2,43 MBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.