Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://earchive.tpu.ru/handle/11683/23823
Название: Извлечение и анализ данных о судопроизводстве в г. Томске с помощью технологий OLAP И Data Mining
Авторы: Щукова, К. Б.
Хлопонин, А. А.
Паршина, Д. М.
Научный руководитель: Кудинов, Антон Викторович
Ключевые слова: судопроизводство; Data mining; OLAP; Microsoft SQL Server; регулярные выражения; шинглы; анализаторы; реляционные базы данных
Дата публикации: 2015
Библиографическое описание: Щукова К. Б. Извлечение и анализ данных о судопроизводстве в г. Томске с помощью технологий OLAP И Data Mining / К. Б. Щукова, А. А. Хлопонин, Д. М. Паршина ; науч. рук. А. В. Кудинов // Технологии Microsoft в теории и практике программирования : сборник трудов XII Всероссийской научно-практической конференции студентов, аспирантов и молодых ученых, г.Томск, 25-26 марта 2015 г. — Томск : Изд-во ТПУ, 2015. — [С. 105-106].
Аннотация: The article is intended to analyze various data obtained from websites of regional and district Tomsk courts via advanced analytic technologies such as OLAP and Data Mining. The process of comparing structure web pages and parsing HTML pages using PHP and C# is considered in details. Near-duplicates and shingling, as well as regular expressions and Levenshtein distance stand for analyzing and comparing texts, sentences and words. Due to these algorithms, the issue relating to extraction of necessary units can be sorted out effectively and quite accurately.
URI: http://earchive.tpu.ru/handle/11683/23823
Располагается в коллекциях:Материалы конференций

Файлы этого ресурса:
Файл Описание РазмерФормат 
conference_tpu-2015-C28-045.pdf135,88 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.