Use este identificador para citar ou linkar para este item:
http://riu.ufam.edu.br/handle/prefix/5849
Tipo de documento: | Trabalho de Conclusão de Curso |
Título: | Aprendizagem por reforço como técnica de controle para o problema do pêndulo invertido |
Título(s) alternativo(s): | Reinforcement learning as a control technique for the inverted pendulum problem |
Autor(a): | Krul, Alexandre Mendonça |
Orientador(a): | Chui, Danilo de Santana |
metadata.dc.contributor.referee1: | Silva Neto, Gustavo Cunha da |
metadata.dc.contributor.referee2: | Martins, Paulo Roberto Oliveira |
Resumo: | Neste trabalho procura-se utilizar algoritmos de Machine Learning para resolver o problema do pêndulo invertido com um grau de liberdade e comparar os resultados com a técnica de alocação de polos. Com esse objetivo, foram implementados três algoritmos de aprendizagem por reforço, HillClimbing com escala adaptativa de ruído, REINFORCE e DeepQNetworks em linguagem computacional python e seus resultados foram comparados entre si e com o método de controle em espaço de estados por alocação de polos. Foi possível observar que todos osmétodos utilizados conseguiram atingir o objetivo de equilibrar o pêndulo. Os erros ITAE em relação à posição angular vertical para os métodos HillClimbing, REINFORCE, DeepQNetworks e Alocação de Polos foram de 410, 55, 50 e 52, respectivamente. |
Resumo em outro idioma: | This work aims to utilize some Machine Learning algorithms to solve the inverted pendulum problem with one degree of freedom and compare the outcomes with the pole placement method. In this way, three reinforcement learning algorithms were implemented in python: HillClimbing with adaptive noise scaling, REINFORCE and DeepQNetworks and their results were compared with the state space pole placement method, also implemented in this work. The results showed that all the methodwere able to balance the pendulum. The ITAE errors with relation to the vertical angular position for the methods HillClimbing, REINFORCE, DeepQNetworks and Pole Placement were 410, 55, 50 and 52, respectively. |
Palavras-chave: | Controle de sistemas dinâmicos Aprendizado de máquinas Pêndulo invertido Aprendizado por reforço |
Área de conhecimento - CNPQ: | ENGENHARIAS |
Idioma: | por |
País de publicação: | Brasil |
Faculdade, Instituto ou Departamento: | Departamento de Engenharia Mecânica da Faculdade de Tecnologia |
metadata.dc.publisher.course: | Engenharia Mecânica - Bacharelado - Manaus |
Tipo de acesso: | Acesso Aberto |
URI: | http://riu.ufam.edu.br/handle/prefix/5849 |
Vocabulário controlado: | Alocação de Polos Machine learning Linguagem computacional DeepQNetworks |
Aparece nas coleções: | Trabalho de Conclusão de Curso - Graduação - Engenharias |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
TCC_AlexandreKrul.pdf | TCC Engenharia Mecânica | 3,15 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.