Short Papers
Busca-objeto, Classificação de Páginas Web, Páginas-objeto
Este artigo propõe um novo método, denominado OPIS, para a identificação e a busca de páginas-objeto, que são páginas que representam um único objeto do mundo real na web. A motivação para este trabalho se encontra no fato de que os motores de busca convencionais não conseguem responder a buscas por páginas-objeto de forma satisfatória atualmente, já que a quantidade de páginas-objeto recuperada é bastante limitada. OPIS caracteriza-se por adotar técnicas de pré-processamento de texto e de aprendizagem de máquina na classificação de páginas. Quando integrado a um motor de busca convencional, ele permite que somente páginas classificadas como páginas-objeto sejam recuperadas pelas consultas do usuário, ao invés de todas as páginas que contêm os termos da consulta. Experimentos preliminares mostram que o OPIS melhora em média 56% da precisão dos resultados de busca por páginas-objeto, quando comparado a um motor de busca convencional.
Miriam Colpo, Edimar Manica, Renata Galante