Please use this identifier to cite or link to this item:
http://earchive.tpu.ru/handle/11683/4242
Title: | Классификация текстов на основе оценки семантической близости терминов |
Authors: | Нгуен Ба Нгок Тузовский, Анатолий Федорович |
Keywords: | классификация; тексты; классификаторы; k-Nearest Neighbor; kNN; семантическая близость; термины; части речи; фильтрация; матрицы; совместная встречаемость; размерность |
Issue Date: | 2012 |
Publisher: | Томский политехнический университет |
Citation: | Нгуен Ба Нгок. Классификация текстов на основе оценки семантической близости терминов / Нгуен Ба Нгок, А. Ф. Тузовский // Известия Томского политехнического университета [Известия ТПУ]. — 2012. — Т. 320, № 5 : Управление, вычислительная техника и информатика. — [С. 43-48]. |
Abstract: | Рассматривается способ увеличения точности классификации текстов по алгоритму kNN путем применения оценки семантической близости на основе матрицы совместной встречаемости терминов. Предлагается метод уменьшения размера матрицы совместной встречаемости путем фильтрации терминов по частям речи. Выполнена проверка влияния метода фильтрации на точность классификации. |
URI: | http://earchive.tpu.ru/handle/11683/4242 |
ISSN: | 1684-8519 |
Appears in Collections: | Известия Томского политехнического университета. Инжиниринг георесурсов |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
bulletin_tpu-2012-320-5-08.pdf | 412,19 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.