Please use this identifier to cite or link to this item:
http://earchive.tpu.ru/handle/11683/80895
Title: | Мультиклассовая классификация корпуса смешанных текстов алгоритмами машинного обучения |
Authors: | Гузеев, Е. В. |
metadata.dc.contributor.advisor: | Семёнов, М. Е. |
Keywords: | машинное обучение; алгоритмы |
Issue Date: | 2023 |
Publisher: | Томский политехнический университет |
Citation: | Гузеев, Е. В. Мультиклассовая классификация корпуса смешанных текстов алгоритмами машинного обучения / Е. В. Гузеев ; науч. рук. М. Е. Семёнов ; Национальный исследовательский Томский политехнический университет // Перспективы развития фундаментальных наук — Томск : Изд-во ТПУ, 2023. — Т. 3 : Математика. — С. 53-55. |
Abstract: | This paper compares different machine learning algorithms for multiclass classification of mixed texts corpus. The F1-score was used as a quality metric for the algorithm comparison. The algorithms with acceptable quality for the corpus of texts were selected in the process. The dataset includes 7863 rows and 4 features, the gradient boosting showed the best result based on metric F1=0.771. |
URI: | http://earchive.tpu.ru/handle/11683/80895 |
Appears in Collections: | Материалы конференций |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
conference_tpu-2023-C21_V3_p53-55.pdf | 663,28 kB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License