Use este identificador para citar ou linkar para este item: http://riu.ufam.edu.br/handle/prefix/3163
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisor1David Braga Fernandes de Oliveira-
dc.creatorErickson Higor da Silva Alves-
dc.date.accessioned2016-09-23T15:25:35Z-
dc.date.available2016-09-23T15:25:35Z-
dc.date.issued2013-07-31-
dc.identifier.urihttp://riu.ufam.edu.br/handle/prefix/3163-
dc.description.resumoO conteúdo de uma página Web é tipicamente organizado através de blocos de informações presentes em seu interior, obedecendo a estrutura interna e o layout da página. Um problema pouco explorado na literatura é como selecionar os blocos de informações mais importantes de uma página, e então dispô-los de forma a criar uma versão miniaturizada da página original. A essa versão miniaturizada damos o nome de resumo estruturado da página Web (vide Figura 1). Através deste trabalho de iniciação científica, pretendemos criar um método de geração automática de resumos estruturados de páginas Web. Uma forma bastante simples para se alcançar esse objetivo é através das páginas de índice, que são páginas Web contendo resumos estruturados de outras páginas do mesmo Web site. Um problema com a extração direta de resumos estruturados a partir das páginas de índice é que o formato dos resumos pode variar muito de site para site. O objetivo deste trabalho é criar um método para padronizar a disposição das informações dos resumos extraídos a partir de páginas de índice. Para tanto, pretendemos criar formatos padrões de resumos para determinados domínios de aplicação (produtos, filmes, notícias, etc), de forma que os resumos de um mesmo domínio sejam sempre reestruturados em um mesmo formato. Desta forma, uma vez que um resumo tenha sido extraído de uma página de índice, suas informações deverão ser rearranjadas conforme o domínio da aplicação do resumo. Uma possível estratégia a ser avaliada é rotular cada um dos seus blocos de informação usando a estratégia proposta em [Altigran et al., 2007], e então preencher o modelo de domínio correspondente com base nos rótulos encontrados.pt_BR
dc.description.sponsorshipCNPQpt_BR
dc.formatPDF-
dc.languagept_BRpt_BR
dc.publisherUniversidade Federal do Amazonaspt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentCiências da Computacaopt_BR
dc.publisher.departmentInstituto de Ciências Exataspt_BR
dc.publisher.programPROGRAMA PIBIC 2012pt_BR
dc.publisher.initialsUFAMpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectResumos estruturados-
dc.subjectPáginas de índice-
dc.subject.cnpqCIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃOpt_BR
dc.titleIniciação Científica em Extração e Uniformização de Resumos Estruturados de Páginas de Índicept_BR
dc.typeRelatório de Pesquisapt_BR
dc.pibic.cursoEngenharia da Computaçãopt_BR
dc.pibic.nrprojetoPIB-E/0119/2012-
dc.pibic.projetoIniciação Científica em Extração e Uniformização de Resumos Estruturados de Páginas de Índice-
dc.pibic.dtinicio2012-08-01-
dc.pibic.dtfim2013-07-31-
Aparece nas coleções:Relatórios finais de Iniciação Científica - Ciências Exatas e da Terra

Arquivos associados a este item:
Arquivo TamanhoFormato 
Relatório_Final_-_Erickson.pdf408,9 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.