Use este identificador para citar ou linkar para este item:
http://riu.ufam.edu.br/handle/prefix/3865
Tipo de documento: | Relatório de Pesquisa |
Título: | Aplicação do modelo vetorial para o estudo de um motor de busca voltado para documentos textuais |
Autor(a): | Romário Lira Batista |
Orientador(a): | Aurélio Andrade de Menezes Júnior |
Resumo: | Com o crescimento do volume de publicações, ao longo dos anos, foram desenvolvidas técnicas de recuperação de informação para responder as necessidades dos usuários de bibliotecas, tradicionais ou digitais. Atualmente, já não é viável falar em crescimento do volume das publicações mas sim em uma verdadeira explosão, porém, esse cenário torna difícil a tarefa de encontrar uma informação específica no meio dessa grande quantidade. Nesse contexto, a Recuperação da Informação, que é uma área da informática que lida com o armazenamento de documentos e a recuperação automática de informações associadas a eles, trata da ciência de pesquisa que possibilita a busca por informações em documentos, busca pelos documentos propriamente ditos e busca em banco de dados, sendo assim, ela busca estudar técnicas de armazenamento, processos de busca, recuperação e apresentação de forma amigável das informações. Logo, um método de busca faz-se necessário para suprir a necessidade de encontrar informações específicas em documentos textuais (artigos científicos, artigos jornalisticos, etc.). Modelo Vetorial, ou Modelo de Espaço Vetorial, é uma técnica aplicada na Recuperação da Informação e representa documentos e consultas como vetores de termos. Termos são ocorrências únicas nos documentos. Os documentos devolvidos para uma consulta são representados similarmente, ou seja, o vetor resultado para uma consulta é montado através de um cálculo de similaridade. Em outras palavras, o Modelo Vetorial propõe um ambiente no qual é possível obter documentos que respondem parcialmente a uma expressão de busca, ou seja, como resultado obtém-se um conjunto de documentos ordenado pelo grau de similaridade de cada documento em relação a expressão de busca. A aplicação deste modelo nesse trabalho vem devido a sua vantagem sobre os demais modelos, que é a sua simplicidade e a sua facilidade de entendimento. Porém, faz-se necessário que, além de ter conhecimento a cerca do Modelo Vetorial, o aluno aplique esse conhecimento em algo dentro do contexto de Recuperação da Informação. Um objeto de estudo para a área de Recuperação da Informação são as máquinas de busca, ou motor de busca, estas por sua vez são um sistema de software projetado para encontrar informações armazenadas em um sistema computacional a partir de palavras-chave indicadas pelo utilizador, reduzindo o tempo necessário para encontrar informações solicitadas na busca. A Recuperação da Informação possibilita também que, após os estudos e/ou implementações de um Motor de Busca apliquem-se métodos de avaliação para comprovar a eficiência do Motor de Busca. Portanto, o objetivo deste projeto é aplicar o conhecimento matemático do Modelo Vetorial no estudo de um Motor de Busca para documentos textuais de uma base de dados e estudar os diversos métodos de avaliação e escolher o mais viável para aplicar em cima do motor de busca afim de comprovar sua autenticidade. |
Palavras-chave: | Recuperação da Informação Máquina de Busca Modelo Vetorial |
Área de conhecimento - CNPQ: | CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
Idioma: | pt_BR |
País de publicação: | Brasil |
Editor: | Universidade Federal do Amazonas |
Sigla da Instituição: | UFAM |
Faculdade, Instituto ou Departamento: | Instituto de Ciências Exatas e Tecnologia - Itacoatiara |
Nome do programa: | PROGRAMA PIBIC 2013 |
Tipo de acesso: | Acesso Aberto |
URI: | http://riu.ufam.edu.br/handle/prefix/3865 |
Data do documento: | 31-jul-2014 |
Aparece nas coleções: | Relatórios finais de Iniciação Científica - Ciências Exatas e da Terra |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
PIB001R.pdf | 615,94 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.