Please use this identifier to cite or link to this item: http://earchive.tpu.ru/handle/11683/4242
Title: Классификация текстов на основе оценки семантической близости терминов
Authors: Нгуен Ба Нгок
Тузовский, Анатолий Федорович
Keywords: классификация; тексты; классификаторы; k-Nearest Neighbor; kNN; семантическая близость; термины; части речи; фильтрация; матрицы; совместная встречаемость; размерность
Issue Date: 2012
Publisher: Томский политехнический университет
Citation: Нгуен Ба Нгок. Классификация текстов на основе оценки семантической близости терминов / Нгуен Ба Нгок, А. Ф. Тузовский // Известия Томского политехнического университета [Известия ТПУ]. — 2012. — Т. 320, № 5 : Управление, вычислительная техника и информатика. — [С. 43-48].
Abstract: Рассматривается способ увеличения точности классификации текстов по алгоритму kNN путем применения оценки семантической близости на основе матрицы совместной встречаемости терминов. Предлагается метод уменьшения размера матрицы совместной встречаемости путем фильтрации терминов по частям речи. Выполнена проверка влияния метода фильтрации на точность классификации.
URI: http://earchive.tpu.ru/handle/11683/4242
ISSN: 1684-8519
Appears in Collections:Известия Томского политехнического университета. Инжиниринг георесурсов

Files in This Item:
File Description SizeFormat 
bulletin_tpu-2012-320-5-08.pdf412,19 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.