TrustRank
Da Wikipedia, l'enciclopedia libera.
Il TrustRank è una tecnica di analisi dei link di un sito web per distinguere le pagine web "utili" ai fini della navigazione dallo spam. Il nome è stato acquistato da Google il 16 marzo 2005.
[modifica] Differenza col PageRank
Il PageRank di Google è un diffuso algoritmo, sul quale si è fondata per anni (e si basa tuttora) l’indicizzazione di Google, che assegna un punteggio ad ogni pagina Web, basandosi sul numero di link che riportano ad essa. Il fondamento è che, se molte pagine linkano tutte ad uno stesso indirizzo, esso deve essere ovviamente importante; quest’attività può essere considerata una versione più raffinata e complessa della Link Popularity.
Il modus operandi del web-spam, che permette al Page Rank di crescere, agisce essenzialmente attraverso due vie:
1) link e parole chiave nascoste, che vengono comunque indicizzate dai motori di ricerca;
2) creazione di numerose pagine che linkano ad un’unica pagina designata in precedenza, in modo da rendere suddetta pagina rilevante per la classificazione da parte del motore.
[modifica] Come funziona il Trust Rank
Il Trust Rank ha lo scopo di aiutare nella classificazione di una pagina o sito web, attraverso un processo che prevede diverse fasi:
1) l’algoritmo seleziona un gruppo di pagine delle quali non è chiaro lo “spam status”, chiamate seed;
2) un esperto umano esamina le pagine e comunica all’algoritmo quali possono essere definite spam (bad pages) e quali no (good pages);
3) l’algoritmo infine identifica le altre pagine sulle basi della precedente classificazione umana.