Poluição nas folksonomias - O Bibliotecário 2.0 (Arquivo)

Já estava a tardar: Combating Spam in Tagging Systems por by Georgia Koutrika,; Frans Effendi,; Zoltan Gyongyi,; Pau Heymann,; Hector Garcia-Molina 15 pages; PDF.

Via ResourceShelf

Termina com:

There are also other interesting aspects of the problem and possible future directions to look into. For instance, if tags are related, e.g., there is a tag hierarchy, can we devise smart algorithms that take into account tag relationships? If we track the time at which postings are made, can we better deal with spammers? For example, would it help to give more weight to recent tags as opposed to older tags? Also, if users can also use negative tags, e.g., this document is not about “cars”, what would be the impact on searches?

Mais uma vez esta malta que andou a dormir durante as aulas de introdução aos serviços bibliográficos das respectivas universidades descobrem porque é que os documentalistas usam classificações hierárquicas, têm pesadelos com polisemias, etc.

Welcome to our world!

Aquela das tags negativas no entanto parece interessante… se um objecto é indexável como “não é sobre carros”, não será também indexável (se não o fôr) por “não é encefalopatia espongiforme bovina”… Consideremos o Jaguar (carro) / jaguar (animal felino). Indexar ou etiquetar com “felino” um tal objecto e evitar todas as referências a termos relacionados com automóveis, não seria suficiente? Hum… pensando melhor temos de derimir “veloz” um atributo comum aos dois conceitos… Portanto: “jaguar” “felino” “veloz” “animal” “não é um carro”, ou a presença de “animal” é pista suficiente para o ente que recupera a informação por meio deste instrumento de pesquisa? Para o humano é, para a máquina não, e é esta que decide que resultados nos apresenta… não somos nós que pesquisamos… apenas lemos os resultados da pesquisa da máquina…

PS: Muito importante: para quem esteja a fazer trabalho sobre folsksomonias: ver as referências bibliográficas deste documento.