Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://earchive.tpu.ru/handle/11683/80895
Название: | Мультиклассовая классификация корпуса смешанных текстов алгоритмами машинного обучения |
Авторы: | Гузеев, Е. В. |
Научный руководитель: | Семёнов, М. Е. |
Ключевые слова: | машинное обучение; алгоритмы |
Дата публикации: | 2023 |
Издатель: | Томский политехнический университет |
Библиографическое описание: | Гузеев, Е. В. Мультиклассовая классификация корпуса смешанных текстов алгоритмами машинного обучения / Е. В. Гузеев ; науч. рук. М. Е. Семёнов ; Национальный исследовательский Томский политехнический университет // Перспективы развития фундаментальных наук — Томск : Изд-во ТПУ, 2023. — Т. 3 : Математика. — С. 53-55. |
Аннотация: | This paper compares different machine learning algorithms for multiclass classification of mixed texts corpus. The F1-score was used as a quality metric for the algorithm comparison. The algorithms with acceptable quality for the corpus of texts were selected in the process. The dataset includes 7863 rows and 4 features, the gradient boosting showed the best result based on metric F1=0.771. |
URI: | http://earchive.tpu.ru/handle/11683/80895 |
Располагается в коллекциях: | Материалы конференций |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
conference_tpu-2023-C21_V3_p53-55.pdf | 663,28 kB | Adobe PDF | Просмотреть/Открыть |
Лицензия на ресурс: Лицензия Creative Commons