Use este identificador para citar ou linkar para este item:
http://riu.ufam.edu.br/handle/prefix/4838
Tipo de documento: | Relatório de Pesquisa |
Título: | Técnicas Baseadas em Similaridade de Árvores para Extração de Dados da Web em Larga Escala |
Autor(a): | Daniel Fernandes da Silva Pereira |
Orientador(a): | Altigran Soares da Silva |
Resumo: | Neste trabalho será desenvolvido um método automático para o problema de extrair pares valor-atributo presentes em páginas Web ricas em dados. O método será baseado em Algoritmo de Alinhamento de Árvores para encontrar nestas páginas exemplos de pares que correspondem a objetos de interesse. Em seguida, o método deve gerar expressões regulares para extrair pares atributo-valor similares aos exemplos dados. |
Palavras-chave: | Distância de Edição em Árvores, Extração de Dados |
Área de conhecimento - CNPQ: | CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
Idioma: | pt_BR |
País de publicação: | Brasil |
Editor: | Universidade Federal do Amazonas |
Sigla da Instituição: | UFAM |
Faculdade, Instituto ou Departamento: | Ciências da Computação Instituto de Ciências Exatas |
Nome do programa: | PROGRAMA PIBIC 2014 |
Tipo de acesso: | Acesso Aberto |
URI: | http://riu.ufam.edu.br/handle/prefix/4838 |
Data do documento: | 31-jul-2015 |
Aparece nas coleções: | Relatórios finais de Iniciação Científica - Ciências Exatas e da Terra |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Relatório_Final_Daniel.pdf | 280,36 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.