Der Effekt eingehender Links
Es wurde bereits gezeigt,
dass ein jeder eingehender Link auf
ein Webseite deren Pagerank stets erhöht. Bei
oberflächlicher Betrachtung des ursprünglichen
PageRank-Algorithmus
PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))
möchte man meinen, ein zusätzlicher
eingehender Link erhöht den PageRank der verlinkten Seite um
d × PR(X) / C(X)
wobei PR(X) der PageRank
der verlinkenden Seite X und C(X) deren Anzahl ausgehender Links ist. Bei
genauerer Betrachtung zeigt
sich allerdings, dass eine Webseite, die einen zusätzlichen
eingehenden Link erhält, selbst auch auf andere Webseiten
verlinken kann. Diese erhalten nunmehr ebenfalls einen höheren
PageRank, den sie gegebenfalls wiederum über Links an unsere
Seite mit dem zusätzlichen eingehenden Link
zurückgeben.
Die einzelnen Effekte zusätzlicher
eingehender Links
sollen nun anhand eines Beispiels beschrieben werden.
Wir betrachten eine kleine
Website aus den Seiten A, B, C und D, die im Kreis verlinkt sind und nicht
selbst auf andere Webseiten
verlinken. Ohne eingehende Links von externen Seiten ergibt sich ganz
offensichtlich ein PageRank von 1 für jede der betrachteten
Seiten. Wir wählen nunmehr eine Seite X, für die ein
PageRank PR(X) von 10 angenommen wird. Seite X verlinkt auf Seite A und
sonst auf keine andere Seite. Bei einem willkürlich
gewählten Dämpfungsfaktor von 0.5 ergibt sich das
folgende Gleichungssystem für den PageRank der einzelnen
Seiten unserer Site:
PR(A) = 0.5 + 0.5 (PR(X) + PR(D)) = 5.5 + 0.5 PR(D)
PR(B) = 0.5 + 0.5 PR(A)
PR(C) = 0.5 + 0.5 PR(B)
PR(D) = 0.5 + 0.5 PR(C)
Da die Anzahl der ausgehenden
Links jeder Seite gleich 1 ist,
müssen diese hier nicht berücksichtigt werden. Die
Lösung des Gleichungssystems ergibt folgende Werte
für den PageRank der einzelnen Seiten:
PR(A) = 19/3 = 6.33
PR(B) = 11/3 = 3.67
PR(C) = 7/3 = 2.33
PR(D) = 5/3 = 1.67
Der unmittelbare Effekt
des zusätzlichen Links auf
Seite A in Höhe von
d × PR(X) / C(X) = 0,5 × 10
/ 1 = 5
setzt sich also über
die Verlinkung der einzelnen
Seiten untereinander fort.
Der
Einfluss des Dämpfungsfaktors
Der Grad der Weitergabe
von PageRank ist vor allem auch
abhängig von der Höhe des Dämpfungsfaktors
d. Wird für diesen beispielsweise ein Wert von 0.75
angenommen, ergibt sich für das obige Beispiel das folgende
Gleichungssystem:
PR(A) = 0.25 + 0.75 (PR(X) + PR(D)) = 7.75 + 0.75 PR(D)
PR(B) = 0.25 + 0.75 PR(A)
PR(C) = 0.25 + 0.75 PR(B)
PR(D) = 0.25 + 0.75 PR(C)
Die Lösung dieses Gleichungssystems ergibt folgende
Werte für den PageRank der einzelnen Seiten:
PR(A) = 419/35 = 11.97
PR(B) = 323/35 = 9.23
PR(C) = 251/35 = 7.17
PR(D) = 197/35 = 5.63
Es zeigt sich zunächst ein wesentlich
höherer unmittelbarer Effekt des zusätzlichen
eingehenden Links auf den PageRank von Seite A in Höhe von
d × PR(X) / C(X) = 0.75 × 10
/ 1 = 7.5
Dieser Effekt setzt sich
nun aber noch verstärkt
durch die interne Verlinkung der Seiten fort, so dass der PageRank von
Seite A bei einem Dämpfungsfaktor von 0.75 beinahe doppelt so
hoch ist wie bei einem Dämpfungsfaktor von 0.5. Ist der
PageRank von Seite A bei einem Dämpfungsfaktor von 0.5 noch
beinahe viermal größer als der Pagerank von Seite D,
so ist er bei einem Dämpfungsfaktor von 0.75 nur noch etwas
mehr als doppelt so groß. Je höher der
Dämpfungsfaktor ist, um so stärker ist einerseits der
Effekt auf den PageRank der den Link erhaltenden Seite und um so
gleichmäßiger verteilt sich andererseits der
PageRank auf die anderen Seiten der Site.
Der
tatsächliche
Effekt eingehender
Links
Die Summe der PageRank-Werte
aller Seiten bei einem
Dämpfungsfaktor von 0.5 beträgt in unserem Beispiel
PR(A) + PR(B) + PR(C) + PR(D) = 14
Dadurch, dass eine Seite
mit einem PageRank von 10 mit ihrem einzigen Link auf eine Seite der Beispiel-Site
verlinkt,
erhöht sich also deren aufaddierter PageRank um 10. (Vor
Erhalt des Links hatte jede Seite einen PageRank von 1.) Bei einem
PageRank von 0.75 beträgt die Summe der PageRank-Werte
PR(A) + PR(B) + PR(C) + PR(D) = 34
Der aufaddierte PageRank
erhöht sich also um 30. Es
zeigt sich, dass sich die Summe des PageRanks stets um
(d / (1-d)) × (PR(X)
/ C(X))
erhöht, wenn X die
verlinkende Seite, PR(X) deren PageRank und C(X) die Anzahl der ausgehenden
Links von Seite X ist.
Dieser Wert ist allerdings daran gebunden, dass die Verlinkung in ein
geschlossenes Sytem von Webseiten, also etwa eine Website ohne
ausgehenden Link erfolgt. Sofern von der Website Links auf andere,
externe Webseiten gesetzt sind, verringert sich der Faktor entsprechend.
Die Begründung für den oben angegebenen Wert
liefert uns Raph Levien und sie bezieht sich auf das Random Surfer
Modell. Die Länge eines Surf-Vorgangs des Zufalls-Surfers ist
eine Exponentialverteilung mit einem Mittel von (d/(1-d)). Wenn also
der Zufalls-Surfer einen Link auf ein geschlossenes System von
Webseiten verfolgt, besucht er im Schnitt genau (d/(1-d)) Seiten
innerhalb dieses geschlossenen Systems. Und genau so viel mehr PageRank
der ursprünglich verlinkenden Seite - gewichtet nach der
Anzahl der ausgehenden Links - muss damit an das geschlossene System
übertragen werden.
Lawrence Page und Sergey
Brin geben
regelmäßig einen Dämpfungsfaktor von 0.85
für die tatsächliche PageRank-Berechnung an. Damit
ergibt sich ein Faktor für die Erhöhung des
aufaddierten PageRanks einer geschlossenen Site durch einen
zusätzlichen eingehenden Link von Seite X in Höhe von
(0.85 / 0.15) × (PR(X) / C(X)) = 5.67 × (PR(X)
/ C(X))
Eingehende Links haben
also einen weitaus
größeren Effekt auf den PageRank als man bei
oberflächlicher Betrachtung annehmen mag.
Die PageRank-1 Regel
Viele Nutzer der Google
Toolbar stellen fest, dass oftmals Seiten mit einem bestimmten Toolbar-PageRank
eine darauf verlinkende
Seite mit einem Toolbar-PageRank aufweisen, der um den Wert 1
höher ist als der der verlinkten Seite. Diese Beobachtung
dient vielfach dazu, den hier präsentierten
PageRank-Algorithmus in Frage zu stellen. Dagegen soll an dieser Stelle
gezeigt werden, dass die Beobachtung vollkommen im Einklang mit dem
hier präsentierten PageRank-Algorithmus steht.
Zuallererst stützt die PageRank-1 Regel das
grundlegende Konzept des PageRank-Verfahrens. Webseiten sind genau dann
bedeutsam, wenn andere bedeutsame Webseiten auf sie verweisen. Es ist
nicht erforderlich, dass eine Website viele eingehenden Links
erhält, um einen hohen PageRank zu bekommen. Ein einzelner
Link von einer Website mit einem hohen PageRank reicht hierzu aus.
Dafür, dass die PageRank-1 Regel auch mit dem hier
präsentierten PageRank-Algorithmus in Einklang steht, sind
mehrere Faktoren verantwortlich. Zunächst ist Toolbar-PageRank
eine logarithmisch skalierte Version des tatsächlichen
PageRank. Wenn der PageRank einer verlinkenden Seite im Sinne der
Toolbar um eins höher ist als derjenige der verlinkten Seite,
so kann ihr tatsächlicher PageRank immer mindestens um einen
Faktor höher sein, der der Basis des für die
Skalierung eingesetzten Logarithmus entspricht. Ist also die Basis des
Logarithmus gleich 6, und der Toolbar-PageRank der verlinkenden Seite
gleich 5, so kann der tatsächliche PageRank der verlinkten
Seite immer mindestens 6 Mal kleiner sein, damit diese in jedem Fall
noch einen Toolbar-PageRank von 4 erreicht.
Der Basis des Logarithmus
wirkt nun die Anzahl der ausgehenden Links auf der verlinkenden Seite entgegen,
da deren PageRank praktisch
unter allen verlinkten Seiten aufgeteilt wird. Es wurde allerdings oben
auf dieser Seite bereits gezeigt, dass der über einen Link an
eine Seite weitergegebene PageRank weitaus größer
sein kann, als der im Algorithmus erscheinenden Term d(PR(Ti)/C(Ti))
vermuten lässt. Dies hängt damit zusammen, dass
intern in der Regel weitere Seiten auf die von außen
verlinkte Seite verlinken und somit weiteren PageRank auf diese Seite
verteilen. Gehen wir nun etwa davon aus, dass die logarithmische Basis
für die Skalierung 6 beträgt und weiterhin bei einem
hohen Dämpfungsfaktor das doppelte des nach ausgehenden Links
gewichteten PageRank der verlinkenden Seite auf die verlinkte Seite
übertragen wird, so könnte die verlinkende Seite
mindestens 12 ausgehende Links haben, damit die verlinkte Seite immer
noch einen Toolbar-PageRank aufweist, der maximal um 1 kleiner ist als
derjenige der verlinkenden Seite.
Eine Zahl von 12 ausgehenden
Links erscheint an dieser Stelle
zugegebenermaßen sehr gering. Allerdings ist es in aller
Regel so, dass wenn eine Webseite von außen verlinkt wird,
dies nicht nur von einer einzelnen Seite geschieht, und der
betrachteten Seite somit noch weiterer PageRank übertragen
wird. Falls sich Beispiele finden, bei der eine Seite durch einen
einzigen externen Link ein PageRank übertragen wird, der der
PageRank-1 Regel entspricht, und die verlinkende Seite eine hohe Zahl
ausgehender Links hat, so ist dies vor allem ein Indiz dafür,
dass der PageRank der verlinkenden Seite sich im oberen Bereich ihres
Toolbar-PageRank-Wertes befindet. Schließlich könnte
die verlinkende Seite aus unserem Beispiel eine "hohe" 5 und die
verlinkte Seite eine "tiefe" 4 sein. In diesem Falle könnte
die verlinkende Seite bis zu 72 ausgehende Links aufweisen. Diese Zahl
würde sich weiter erhöhen, wenn wir von einer
größeren logarithmischen Basis für die
Skalierung des Toolbar-PageRanks ausgehen.
PageRank
und Google sind geschützte Marken der Google Inc., Mountain
View CA, USA. Das PageRank Verfahren unterliegt dem US Patent
6,285,999.
Copyright by pr.efactory.de
|