Please use this identifier to cite or link to this item: http://earchive.tpu.ru/handle/11683/80895
Title: Мультиклассовая классификация корпуса смешанных текстов алгоритмами машинного обучения
Authors: Гузеев, Е. В.
metadata.dc.contributor.advisor: Семёнов, М. Е.
Keywords: машинное обучение; алгоритмы
Issue Date: 2023
Publisher: Томский политехнический университет
Citation: Гузеев, Е. В. Мультиклассовая классификация корпуса смешанных текстов алгоритмами машинного обучения / Е. В. Гузеев ; науч. рук. М. Е. Семёнов ; Национальный исследовательский Томский политехнический университет // Перспективы развития фундаментальных наук — Томск : Изд-во ТПУ, 2023. — Т. 3 : Математика. — С. 53-55.
Abstract: This paper compares different machine learning algorithms for multiclass classification of mixed texts corpus. The F1-score was used as a quality metric for the algorithm comparison. The algorithms with acceptable quality for the corpus of texts were selected in the process. The dataset includes 7863 rows and 4 features, the gradient boosting showed the best result based on metric F1=0.771.
URI: http://earchive.tpu.ru/handle/11683/80895
Appears in Collections:Материалы конференций

Files in This Item:
File Description SizeFormat 
conference_tpu-2023-C21_V3_p53-55.pdf663,28 kBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons