Please use this identifier to cite or link to this item:
http://earchive.tpu.ru/handle/11683/80895| Title: | Мультиклассовая классификация корпуса смешанных текстов алгоритмами машинного обучения |
| Authors: | Гузеев, Е. В. |
| metadata.dc.contributor.advisor: | Семёнов, М. Е. |
| Keywords: | машинное обучение; алгоритмы |
| Issue Date: | 2023 |
| Publisher: | Томский политехнический университет |
| Citation: | Гузеев, Е. В. Мультиклассовая классификация корпуса смешанных текстов алгоритмами машинного обучения / Е. В. Гузеев ; науч. рук. М. Е. Семёнов ; Национальный исследовательский Томский политехнический университет // Перспективы развития фундаментальных наук — Томск : Изд-во ТПУ, 2023. — Т. 3 : Математика. — С. 53-55. |
| Abstract: | This paper compares different machine learning algorithms for multiclass classification of mixed texts corpus. The F1-score was used as a quality metric for the algorithm comparison. The algorithms with acceptable quality for the corpus of texts were selected in the process. The dataset includes 7863 rows and 4 features, the gradient boosting showed the best result based on metric F1=0.771. |
| URI: | http://earchive.tpu.ru/handle/11683/80895 |
| Appears in Collections: | Материалы конференций |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| conference_tpu-2023-C21_V3_p53-55.pdf | 663,28 kB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License