Use este identificador para citar ou linkar para este item: http://riu.ufam.edu.br/handle/prefix/4838
Tipo de documento: Relatório de Pesquisa
Título: Técnicas Baseadas em Similaridade de Árvores para Extração de Dados da Web em Larga Escala
Autor(a): Daniel Fernandes da Silva Pereira
Orientador(a): Altigran Soares da Silva
Resumo: Neste trabalho será desenvolvido um método automático para o problema de extrair pares valor-atributo presentes em páginas Web ricas em dados. O método será baseado em Algoritmo de Alinhamento de Árvores para encontrar nestas páginas exemplos de pares que correspondem a objetos de interesse. Em seguida, o método deve gerar expressões regulares para extrair pares atributo-valor similares aos exemplos dados.
Palavras-chave: Distância de Edição em Árvores, Extração de Dados
Área de conhecimento - CNPQ: CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
Idioma: pt_BR
País de publicação: Brasil
Editor: Universidade Federal do Amazonas
Sigla da Instituição: UFAM
Faculdade, Instituto ou Departamento: Ciências da Computação
Instituto de Ciências Exatas
Nome do programa: PROGRAMA PIBIC 2014
Tipo de acesso: Acesso Aberto
URI: http://riu.ufam.edu.br/handle/prefix/4838
Data do documento: 31-jul-2015
Aparece nas coleções:Relatórios finais de Iniciação Científica - Ciências Exatas e da Terra

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Relatório_Final_Daniel.pdf280,36 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.