Tout sur le Net Bienvenue au Soutien du Net!
Trustrank

Le Trustrank est une procédure pour mesurer la qualité des sites Web. Elle fut publié en 2004 par Gyongyi, Garcia-Molina et Pedersen. Le fond de l´idée est assez semblable à celui de l´algorithme du Pagerank - prendre la structure des liens contenus pour générer une mesure pour la qualité d´une page. L´algorithme peut être vu comme un développement supplémentaire de la procédure du Pagerank. Quoi qu´il en soit, un supplément n´est pas toujours aussi une amélioration.

Le point de départ de l´algorithme est la séléction manuelle de bonnes pages (pages dites de confiance). Ces pages sont la source de confiance. La confiance peut être transférée à d´autres pages en liant vers elles (hyperliens). La confiance est propagée de la même manière que le Pagerank.

En supplément on peut séléctionner des sources de spam. Ceci donnera une mesure négative (Pagerank inversé) qui sera propagée à l´inverse et est une mesure de mauvaises pages (spam).
Pour l´algorithme du classement les deux mesures peuvent être prises en compte.
Le Calcul
Une simple variante est donnée par:
TrustRank = M-1 * X

La matrice M (analogue à l´algorithme du Pagerank) est donnée par:
M = 1 – d T
avec d est un facteur d´affaiblissement et X le vecteur source de confiance.

Le Trustrank inversé est donné par:
Minv-1 * Xinv

avec
Minv = 1 - dinv Tinv

La matrice de transition inversée Tinv est définie par: dinv est un facteur d´affaiblissement et Xinv le vecteur source du spam (mauvaises pages) et ninv est le nombre de liens entrants sur la page j. Minv n´est ni un transposant ni la matrice inversée de M.

A l´opposé de la matrice de transition normale qui est définie par les liens entrants, Tinv est la fonction de liens sortants. C´est pourquoi cette mesure pour spam se propage à l´inverse. Ce qui veut dire que sont mauvaises les pages qui donnent des liens vers de mauvaises pages; pendant que sont bonnes les pages vers lesquelles sont donnés des liens venant de bonnes pages.