Please use this identifier to cite or link to this item: http://riu.ufam.edu.br/handle/prefix/5849
Full metadata record
DC FieldValueLanguage
dc.contributor.advisor1Chui, Danilo de Santana-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/5006940841845349pt_BR
dc.contributor.referee1Silva Neto, Gustavo Cunha da-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/9570264281584476pt_BR
dc.contributor.referee2Martins, Paulo Roberto Oliveira-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/9912985025618548pt_BR
dc.creatorKrul, Alexandre Mendonça-
dc.creator.Latteshttp://lattes.cnpq.br/7211087483167119pt_BR
dc.date.accessioned2021-02-17T17:43:30Z-
dc.date.available2021-01-30-
dc.date.available2021-02-17T17:43:30Z-
dc.identifier.urihttp://riu.ufam.edu.br/handle/prefix/5849-
dc.description.abstractThis work aims to utilize some Machine Learning algorithms to solve the inverted pendulum problem with one degree of freedom and compare the outcomes with the pole placement method. In this way, three reinforcement learning algorithms were implemented in python: HillClimbing with adaptive noise scaling, REINFORCE and DeepQNetworks and their results were compared with the state space pole placement method, also implemented in this work. The results showed that all the methodwere able to balance the pendulum. The ITAE errors with relation to the vertical angular position for the methods HillClimbing, REINFORCE, DeepQNetworks and Pole Placement were 410, 55, 50 and 52, respectively.pt_BR
dc.description.resumoNeste trabalho procura-se utilizar algoritmos de Machine Learning para resolver o problema do pêndulo invertido com um grau de liberdade e comparar os resultados com a técnica de alocação de polos. Com esse objetivo, foram implementados três algoritmos de aprendizagem por reforço, HillClimbing com escala adaptativa de ruído, REINFORCE e DeepQNetworks em linguagem computacional python e seus resultados foram comparados entre si e com o método de controle em espaço de estados por alocação de polos. Foi possível observar que todos osmétodos utilizados conseguiram atingir o objetivo de equilibrar o pêndulo. Os erros ITAE em relação à posição angular vertical para os métodos HillClimbing, REINFORCE, DeepQNetworks e Alocação de Polos foram de 410, 55, 50 e 52, respectivamente.pt_BR
dc.languageporpt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentDepartamento de Engenharia Mecânica da Faculdade de Tecnologiapt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectControle de sistemas dinâmicospt_BR
dc.subjectAprendizado de máquinaspt_BR
dc.subjectPêndulo invertidopt_BR
dc.subjectAprendizado por reforçopt_BR
dc.subject.cnpqENGENHARIASpt_BR
dc.titleAprendizagem por reforço como técnica de controle para o problema do pêndulo invertidopt_BR
dc.title.alternativeReinforcement learning as a control technique for the inverted pendulum problempt_BR
dc.typeTrabalho de Conclusão de Cursopt_BR
dc.creator.affiliationUniversidade Federal do Amazonaspt_BR
dc.date.event2021-01-22-
dc.publisher.localpubManauspt_BR
dc.subject.controladoAlocação de Polospt_BR
dc.subject.controladoMachine learningpt_BR
dc.subject.controladoLinguagem computacionalpt_BR
dc.subject.controladoDeepQNetworkspt_BR
dc.contributor.advisor1orcidhttps://orcid.org/0000-0002-0705-1949pt_BR
dc.contributor.advisor1orcidhttps://orcid.org/0000-0002-0705-1949pt_BR
dc.contributor.referee1orcidhttps://orcid.org/0000-0002-1024-6560pt_BR
dc.contributor.referee1orcidhttps://orcid.org/0000-0002-1024-6560pt_BR
dc.creator.affiliation-initUFAMpt_BR
dc.publisher.courseEngenharia Mecânica - Bacharelado - Manauspt_BR
Appears in Collections:Trabalho de Conclusão de Curso - Graduação - Engenharias

Files in This Item:
File Description SizeFormat 
TCC_AlexandreKrul.pdfTCC Engenharia Mecânica3,15 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.