Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://earchive.tpu.ru/handle/11683/1395
Название: Применение вероятностного алгоритма соединения записей для исключения дублирования информации в корпоративной базе данных
Авторы: Пинжин, Алексей Евгеньевич
Ключевые слова: вероятностный алгоритм; записи; дублирование; информация; корпоративные базы данных; крупные организации; крупные предприятия; теоретические основы; оценка; сходства; атрибуты; данные; источники; практические результаты; дубликаты; физические лица; российские вузы
Дата публикации: 2006
Издатель: Томский политехнический университет
Библиографическое описание: Пинжин А. Е. Применение вероятностного алгоритма соединения записей для исключения дублирования информации в корпоративной базе данных / А. Е. Пинжин // Известия Томского политехнического университета [Известия ТПУ]. — 2006. — Т. 309, № 7. — [С. 111-116].
Аннотация: Рассмотрена возможность применения вероятностного алгоритма соединения записей для устранения дублирования информации в базе данных крупной организации или предприятия. Отражены теоретические основы алгоритма, предложены способы оценки степени сходства по основным типам атрибутов, рассмотрены возможности усовершенствования модели путем учета степени достоверности данных, поступающих из разных источников. Приведены практические результаты работы на примере задачи устранения дубликатов записей о физических лицах в единой базе данных российского вуза.
URI: http://earchive.tpu.ru/handle/11683/1395
Располагается в коллекциях:Известия Томского политехнического университета. Инжиниринг георесурсов

Файлы этого ресурса:
Файл Описание РазмерФормат 
bulletin_tpu-2006-309-7-24.pdf369,69 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.