Please use this identifier to cite or link to this item:
http://earchive.tpu.ru/handle/11683/50459
Title: | Разработка алгоритмического и программного обеспечения модуля автоматизированного извлечения контента веб-ресурсов |
Authors: | Евграфов, Денис Андреевич |
metadata.dc.contributor.advisor: | Савельев, Алексей Олегович |
Keywords: | проектирование; разработка; извлечение контента веб-ресурсов; синтаксический анализ; контент; designing; developing; web content mining; parsing; content |
Issue Date: | 2018 |
Citation: | Евграфов Д. А. Разработка алгоритмического и программного обеспечения модуля автоматизированного извлечения контента веб-ресурсов : бакалаврская работа / Д. А. Евграфов ; Национальный исследовательский Томский политехнический университет (ТПУ), Инженерная школа информационных технологий и робототехники (ИШИТР), Отделение информационных технологий (ОИТ) ; науч. рук. А. О. Савельев. — Томск, 2018. |
Abstract: | Проектирование и разработка программного модуля для извлечения данных с веб-ресурсов для исследования общественного мнения. Разработанный модуль осуществляет сбор данных с веб-ресурсов, по методам RSS-запросов и фреймворка Twitter4J, а также предварительную обработку данных по средствам синтаксического анализа. Общение с другими модулями происходит через базу данных в которую происходит выгрузка данных после предварительной обработки. Designing and developing a software module for retrieving data from web resources for research of public opinion. The module developed collects data from web resources, RSS-queries methods and Twitter4J framework, as well as pre-processing data on parsing tools. Communication with other modules occurs through the database in which the data is downloaded after pre-processing. |
URI: | http://earchive.tpu.ru/handle/11683/50459 |
Appears in Collections: | Выпускные квалификационные работы (ВКР) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
TPU584981.pdf | 1,47 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.