Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://earchive.tpu.ru/handle/11683/133207
Название: Эффективность и валидность кластерного анализа содержания микроэлементов пыли снегового покрова
Другие названия: Efficiency and validity of cluster analysis of trace elements content in snow cover dust
Авторы: Захарченко, Александр Викторович
Тигеев, Александр Анатольевич
Ключевые слова: микроэлементы; пыль снегового покрова; стандартизация данных; кластерный анализ; валидность; загрязнение атмосферы; trace elements; snow dust; data standardization; cluster analysis; validity; air pollution
Дата публикации: 2025
Издатель: Томский политехнический университет
Библиографическое описание: Захарченко, А. В. Эффективность и валидность кластерного анализа содержания микроэлементов пыли снегового покрова / Александр Викторович Захарченко, Александр Анатольевич Тигеев // Известия Томского политехнического университета [Известия ТПУ]. Инжиниринг георесурсов. — 2025. — Т. 336, № 9. — С. 97-108.
Аннотация: Актуальность. Кластеризация как метод анализа данных нашла широкое применение в различных областях знания, где требуется классификация объектов исследования. Очевиден поиск алгоритмов, способствующих максимально эффективному использованию метода. Успешность формирования классификационного дерева иерархического кластерного анализа зависит от применяемых методов стандартизации данных. Цель: провести сравнительный анализ методов стандартизации состава химических элементов пыли снегового покрова для оценки экологической опасности загрязнения атмосферы и валидности результатов иерархического кластерного анализа. Объекты и методы. Для примера использован микроэлементный состав твердой фазы снега г. Тюмени и фоновых точек, удаленных от города более чем на 10 км. Содержание в снеговом покрове загрязняющих веществ отражает загрязнение атмосферного воздуха. На примере анализа содержания химических элементов в твердой фазе снегового покрова г. Тюмени обоснованы наиболее простые методы предварительной обработки данных с целью их стандартизации для последующего статистического анализа. Рассмотрено четыре метода стандартизации данных в сравнении с исходными данными. Результативность кластеризации оценена с помощью интегрального показателя экологического загрязнения, а ее валидность - с помощью индекса Калински-Харабаша. Для подтверждения основных выводов результаты сопоставлены с аналогичными данными по Томской области. Результаты. Показано графическое отображение геохимических спектров при использовании разных методов стандартизации данных, а также проведен анализ различий результатов кластеризации. Для их сравнения использованы данные микроэлементного состава снегового покрова Томской области. Выводы. Метод весов (%) «Weight», позволяющий выявить различия относительного содержания микроэлементов в городе и в условиях фона, оказался наиболее эффективным при графическом отображении геохимического спектра. Полагалось, что чем выше их значения, тем эффективней кластеризация; контролем служили те же показатели для снегового покрова Томской области, которые оказались согласованными с показателями для Тюмени. Установлено, что наибольшей эффективностью обладает метод стандартизации медианой и квантилями 0,25 и 0,75 «Median»
Relevance. Clustering, as a method of data analysis, has found wide application in various fields of knowledge where classification of research objects is required. The search for algorithms that facilitate the most efficient use of the method is obvious. The success of forming a classification tree of hierarchical cluster analysis depends on the data standardization methods used. Aim. To conduct a comparative analysis of methods for standardizing the composition of chemical elements of snow dust for assessing the environmental hazard and validity of the results of hierarchical cluster analysis. Objects and methods. As an example, we used the microelement composition of the solid phase of snow in the city of Tyumen and background points more than 10 km away from the city. The content of pollutants in the snow cover reflects atmospheric air pollution. Using the example of analyzing the content of chemical elements in the solid phase of snow cover in the city of Tyumen, the simplest methods of preliminary data processing are substantiated in order to standardize them for subsequent statistical analysis. The paper considers four methods of data standardization in comparison with the original data. The effectiveness of clustering was assessed using the integral indicator of environmental pollution, and its validity - using the Kalinski-Harabash index. To confirm the main conclusions, the results are compared with data for the Tomsk region. Results. The paper shows a graphical display of geochemical spectra using different methods of data standardization, as well as an analysis of the differences in clustering results. To compare them, the data on the microelement composition of the snow cover in the Tomsk region were used. Conclusions. The "Weight" method of weights (%) turned out to be the most effective in graphically displaying the geochemical spectrum, allowing us to identify differences in the relative content of trace elements in the city and in background conditions. It was believed that the higher their values, the more effective the clustering; the control was the same indicators for snow cover in the Tomsk region, which turned out to be consistent with the indicators for Tyumen. It was established that standardization with a median and quantiles of 0.25 and 0.75 "Median" is most effective
URI: http://earchive.tpu.ru/handle/11683/133207
ISSN: 2413-1830
Располагается в коллекциях:Известия Томского политехнического университета. Инжиниринг георесурсов

Файлы этого ресурса:
Файл РазмерФормат 
bulletin_tpu-2025-v336-i9-09.pdf1,49 MBAdobe PDFПросмотреть/Открыть


Лицензия на ресурс: Лицензия Creative Commons Creative Commons