Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://earchive.tpu.ru/handle/11683/81892
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.author | Соколовский, Дмитрий Евгеньевич | ru |
dc.contributor.author | Некрасов, Владимир Николаевич | ru |
dc.contributor.author | Землянский, Сергей Александрович | ru |
dc.contributor.author | Аксёнов, Сергей Владимирович | ru |
dc.date.accessioned | 2024-12-08T15:05:10Z | - |
dc.date.available | 2024-12-08T15:05:10Z | - |
dc.date.issued | 2023 | - |
dc.identifier.citation | Оценка использования инструментов библиотеки SpaCy и DeepPavlov для задачи извлечения именованных сущностей из описаний результатов осмотров пациентов с COVID-19 / Д. Е. Соколовский, В. Н. Некрасов, С. А. Землянский, С. В. Аксёнов // Известия Томского политехнического университета [Известия ТПУ]. Промышленная кибернетика. — 2023. — Т. 1, № 2. — С. 46-53. | ru |
dc.identifier.issn | 2949-5407 | - |
dc.identifier.uri | http://earchive.tpu.ru/handle/11683/81892 | - |
dc.description.abstract | Актуальность. Определяется необходимостью выделения значимых признаков из электронных медицинских записей для автоматизации оценки состояния больных. Цель. Оценка возможности выявления именованных сущностей в электронных описаниях осмотров пациентов с COVID-19 с помощью модели BERT из библиотек SpaCy и DeepPavlov. Методы. Глубокое обучение, статистические методы. Результаты и выводы. Выполнено исследование настройки нейросетевых моделей BERT из библиотек SpaCy и DeepPavlov для аннотирования документов «Осмотр пациентов лечащим врачом» с целью выделения следующих предикторов оценки состояния пациентов: температура, артериальное давление, частота дыхательных движений, частота сердечных сокращений и сатурация. Настройка и оценка эффективности архитектур производилась на основе разметки 340 обезличенных электронных медицинских записей пациентов, болевших COVID-19, полученных с помощью сервиса SibMED Data Clinical Repository. Показано, что настройка моделей на количестве около 150 размеченных документов позволяет определять указанные предикторы в таких текстах с точностью (Precision) 85-98 % и с полнотой (Recall) 77-98 % в зависимости от предиктора. Метрики качества работы архитектур из выбранных библиотек различались незначительно. Отмечено, что итеративное расширение обучающей выборки в результате эксплуатации моделей с последующей донастройкой приводит к повышению результативности моделей | ru |
dc.description.abstract | Relevance.Determined by the need to extract significant features from electronic medical records to automate the assessment of patients' condi-tion.Aim. Assessing the possibility of identifying named entitie in electronic descriptions of examinations of patients with COVID-19 using the BERT model from the SpaCyand DeepPavlov libraries.Methods.Deep learning, statistical methods. Results and conclusions. The authors havecar-ried out a fine-tuning study on BERT neural network models from the SpaCy and DeepPavlov libraries to annotate documents "Examination of pa-tients by the attending physician" in order to highlight the following predictors of patient assessment: temperature, blood pressure, respiratory rate, heart rate and saturation. Configuration and evaluation of the effectiveness of the architectures was carried out based on the markup of 340 anon-ymized electronic medical records of patients with COVID-19, obtained using the SibMED Data Clinical Repository service. It is shown that setting up models on a number of about 150 labeled documents makes it possible to determine the specified predictors in such texts with accuracy (Preci-sion) of 85-98% and completeness (Recall) of 77-98%, depending on the predictor. The quality metrics of the architectures from the selected li-braries differed slightly. Iterative expansion of the training set as a result of the operation of models with subsequent additional tuning leads to an increase in the effectiveness of the models | en |
dc.format.mimetype | application/pdf | - |
dc.language.iso | ru | en |
dc.publisher | Томский политехнический университет | ru |
dc.relation.ispartof | Известия Томского политехнического университета [Известия ТПУ]. Промышленная кибернетика. 2023. Т. 1, № 2 | ru |
dc.rights | info:eu-repo/semantics/openAccess | - |
dc.rights | Attribution-NonCommercial 4.0 International | en |
dc.rights.uri | https://creativecommons.org/licenses/by-nc/4.0/ | - |
dc.source | Известия Томского политехнического университета [Известия ТПУ]. Промышленная кибернетика | ru |
dc.subject | глубокое обучение | ru |
dc.subject | извлечение именованных сущностей | ru |
dc.subject | SpaСy | ru |
dc.subject | BERT | en |
dc.subject | DeepPavlov | en |
dc.subject | Deep learning | en |
dc.subject | named entity extraction | en |
dc.title | Оценка использования инструментов библиотеки SpaCy и DeepPavlov для задачи извлечения именованных сущностей из описаний результатов осмотров пациентов с COVID-19 | ru |
dc.title.alternative | Evaluation of SpaCy and DeepPavlov library tools for named entities recognition from descriptions ofexamination resultsof patients with COVID-19 | en |
dc.type | Article | en |
dc.type | info:eu-repo/semantics/article | - |
dc.type | info:eu-repo/semantics/publishedVersion | - |
dcterms.audience | Researches | en |
local.description.firstpage | 46 | - |
local.description.lastpage | 53 | - |
local.filepath | b_TPU_IndCyb-2023-v1-i2-07.pdf | - |
local.filepath | https://doi.org/10.18799/29495407/2023/2/27 | - |
local.identifier.bibrec | (RuTPU)675387 | - |
local.issue | 2 | - |
local.localtype | Статья | ru |
local.volume | 1 | - |
dc.identifier.doi | 10.18799/29495407/2023/2/27 | - |
Располагается в коллекциях: | Известия Томского политехнического университета. Промышленная кибернетика |
Файлы этого ресурса:
Файл | Размер | Формат | |
---|---|---|---|
b_TPU_IndCyb-2023-v1-i2-07.pdf | 512,89 kB | Adobe PDF | Просмотреть/Открыть |
Лицензия на ресурс: Лицензия Creative Commons