Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://earchive.tpu.ru/handle/11683/82206
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.authorЗалогин, Никита Евгеньевичru
dc.contributor.authorГригорьев, Дмитрий Сергеевичru
dc.date.accessioned2025-01-17T09:46:53Z-
dc.date.available2025-01-17T09:46:53Z-
dc.date.issued2024-
dc.identifier.citationЗалогин, Н. Е. Об обучении интеллектуальных агентов в виртуальной среде для задачи управления роботом-манипулятором / Никита Евгеньевич Залогин, Дмитрий Сергеевич Григорьев // Известия Томского политехнического университета [Известия ТПУ]. Промышленная кибернетика. — 2024. — Т. 2, № 3. — С. 1-8.ru
dc.identifier.issn2413-1830-
dc.identifier.urihttp://earchive.tpu.ru/handle/11683/82206-
dc.description.abstractАктуальность. Определяется необходимостью разработки эффективных методов обучения интеллектуальных агентов для задач управления роботами-манипуляторами в виртуальной среде, что критически важно для повышения точности и эффективности промышленных и исследовательских процессов в различных областях. Цель. Реализация, исследование и модификация алгоритмов обучения с подкреплением, таких как Deep Q-Network (DQN) и Proximal Policy Optimization (PPO), для управления агентами в виртуальной среде KukaDiverseObjectEnv на платформе PyBullet с целью создания моделей, способных точно и надежно взаимодействовать с объектами различных классов. Методы. Программирование, эксперименты и синтез, сравнительный анализ. Результаты и выводы. Проведён сравнительный анализ эффективности алгоритмов DQN и PPO, а также модификаций последнего для обучения агентов в конкретной виртуальной среде. Показано, что обученные агенты способны решать поставленную задачу, а модификации позволяют сократить время обучения и количество необходимых шагов в среде. В результате тестирования алгоритмы продемонстрировали приемлемую точность управления манипулятором, что подтверждается на 1000 тестовых эпизодов среды. Реализованные алгоритмы и разработанные модификации обладают потенциалом для использования в промышленных приложениях и дальнейшего развития в реальных условиях, что подчеркивает их значимость для современной робототехники и автоматизации.ru
dc.description.abstractRelevance. The necessity for developing effective methods for training intelligent agents in robotic manipulator control tasks in a virtual environment is critically important for enhancing the accuracy and efficiency of industrial and research processes across various fields. Aim. Implementation, investigation and modification of reinforcement learning algorithms, such as Deep Q-Network and Proximal Policy Optimization, to manage agents in the KukaDiverseObjectEnv virtual environment on the PyBullet platform in order to create models that can accurately and reliably interact with objects of different classes. Methods. Programming, experimentation and synthesis, and comparative analysis. Results and conclusions. The authors have carried out comparative analysis of the effectiveness of Deep Q-Network and Proximal Policy Optimization algorithms, as well as modifications of the Proximal Policy Optimization for training agents in a particular virtual environment. It was shown that trained agents are able to solve the assigned task, and modifications can reduce the training time and the number steps required in the environment. As a result of testing, the algorithms demonstrated acceptable accuracy in manipulator control, which is validated on 1000 test episodes of the environment. The implemented algorithms and developed modifications have the potential to be used in industrial applications and further development in real-world conditions, which highlights their importance for modern robotics and automationen
dc.format.mimetypeapplication/pdf-
dc.language.isoruen
dc.publisherТомский политехнический университетru
dc.relation.ispartofИзвестия Томского политехнического университета [Известия ТПУ]. Промышленная кибернетика. 2024. Т. 2, № 3ru
dc.rightsinfo:eu-repo/semantics/openAccess-
dc.rightsAttribution-NonCommercial 4.0 Internationalen
dc.rights.urihttps://creativecommons.org/licenses/by-nc/4.0/-
dc.sourceИзвестия Томского политехнического университета [Известия ТПУ]. Промышленная кибернетикаru
dc.subjectобучение с подкреплениемru
dc.subjectвиртуальная средаru
dc.subjectробот-манипуляторru
dc.subjectробототехникаru
dc.subjectDeep Q-networken
dc.subjectProximal policy optimizationen
dc.subjectreinforcement learningen
dc.subjectvirtual environmenten
dc.subjectrobot manipulatoren
dc.subjectroboticsen
dc.titleОб обучении интеллектуальных агентов в виртуальной среде для задачи управления роботом-манипуляторомru
dc.title.alternativeOn training intelligent agents in a virtual environment for the robot manipulator control tasken
dc.typeArticleen
dc.typeinfo:eu-repo/semantics/article-
dc.typeinfo:eu-repo/semantics/publishedVersion-
dcterms.audienceResearchesen
local.description.firstpage1-
local.description.lastpage8-
local.filepathb_TPU_IndCyb-2024-v2-i3-01.pdf-
local.filepathhttps://doi.org/10.18799/29495407/2024/3/61-
local.identifier.bibrec(RuTPU)675959-
local.issue3-
local.localtypeСтатьяru
local.volume2-
dc.identifier.doi10.18799/29495407/2024/3/61-
Располагается в коллекциях:Известия Томского политехнического университета. Промышленная кибернетика

Файлы этого ресурса:
Файл РазмерФормат 
b_TPU_IndCyb-2024-v2-i3-01.pdf861,17 kBAdobe PDFПросмотреть/Открыть


Лицензия на ресурс: Лицензия Creative Commons Creative Commons