Controlador baseado em aprendizado por reforço para robôs seguidores de pessoas

Souza, Fabricio Pinheiro de

Por favor, use este identificador para citar o enlazar este ítem: http://riu.ufam.edu.br/handle/prefix/7014

metadata.dc.type:	Trabalho de Conclusão de Curso
Título :	Controlador baseado em aprendizado por reforço para robôs seguidores de pessoas
metadata.dc.creator:	Souza, Fabricio Pinheiro de
metadata.dc.contributor.advisor1:	Silva, Edson de Araújo
metadata.dc.contributor.referee1:	Oliveira, Felipe Gomes de
metadata.dc.contributor.referee2:	Souza, Adriano Honorato de
metadata.dc.description.resumo:	Este trabalho propõe uma técnica de rastreamento e acompanhamento de pessoas por meio de robôs seguidores, utilizando aprendizado por reforço. A abordagem baseia-se no algoritmo Deep Q-Network (DQN), que combina aprendizado por reforço e redes neurais profundas. A implementação consiste em um ambiente de treinamento customizado e um agente capaz de aprender a se locomover a partir de um cenário criado no simulador Gazebo. O trabalho apresenta uma revisão bibliográfica sobre o tema, seguida pela descrição da metodologia utilizada, que envolve pesquisa nas bases de dados, construção da solução e treinamento do modelo. Como resultado, a técnica proposta demonstrou ser viável para ser aplicada e testada em robôs reais e tem potencial para diversas aplicações, como vigilância, busca e resgate, assistência humana e segurança.
Resumen :	This work proposes a tracking and follow-up technique training of people through follower robots, using learning by reinforcement. The approach is based on the Deep Q-Network (DQN) algorithm, which combines reinforcement learning and deep neural networks. The implementation ˜ consists of a customized training environment and an agent capable of learn to move around from a scenario created in the Gazebo simulator. ' The work presents a bibliographic review on the subject, followed by the description of the methodology used, which involves research in the databases, construction of the solution and training of the model. As a result, the technique is proposal proved to be feasible to be applied and tested in real robots and has potential for several applications, such as surveillance, search and rescue, as- human assistance and security.
Palabras clave :	Robótica OpenAI Gym Deep Q-Network Aprendizado por Reforço ROS
metadata.dc.subject.cnpq:	CIENCIAS EXATAS E DA TERRA
metadata.dc.language:	por
metadata.dc.publisher.country:	Brasil
metadata.dc.publisher.department:	ICET - Instituto de Ciências Exatas e Tecnologia (Itacoatiara)
metadata.dc.publisher.course:	Sistemas de Informações - Bacharelado - Itacoatiara
metadata.dc.rights:	Acesso Aberto
metadata.dc.rights.uri:	An error occurred getting the license - uri. An error occurred getting the license - uri.
URI :	http://riu.ufam.edu.br/handle/prefix/7014
metadata.dc.subject.controlado:	Redes neurais (Computação) Inteligência computacional Robôs - Programação
Aparece en las colecciones:	Trabalho de Conclusão de Curso - Graduação - Ciências Exatas e da Terra

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
TCC_FabricioSouza.pdf		2,14 MB	Adobe PDF	Visualizar/Abrir

Mostrar el registro Dublin Core completo del ítem Recomiende este ítem