Вычисление PageRank

Как вычислить PageRank

Чтобы вычислить PageRank для страницы, необходимо учесть все внутренние и внешние ссылки на эту страницу. Ниже приведено уравнение для расчета значения PageRank страницы А.

PR(A) = (1-d) + d(PR(t1)/C(t1) +... + PR(tn)/C(tn))

PR(t1...tn) - вес страницы, ссылающейся на страницу A,
C - количество исходящих ссылок со страницы А,
d - коэффициент затухания, обычно принимаемый 0.85.

Страница "голосует" своим значением PageRank на каждую страницу, на которую она ссылается. Голосующее значение для страницы складывается из собственной величины PageRank этой страницы * 0.85. Эта величина распределяется равномерно между всеми страницами, на которые ведут исходящие ссылки.

Из уравнения следует, что одна ссылка со страницы с PR4 и пятью исходящими ссылками передаст больший вес, чем ссылка со страницы с PR8 и сотней исходящих ссылок. Чем больше исходящих ссылок на странице, тем меньший PageRank будет передан по такой ссылке.

Заметьте, что когда страница голосует своим значением PageRank за другие страницы, собственный PageRank этой страницы не уменьшается. Голосующая страница не отдает свое значение PageRank. Это похоже на собрание акционеров, где каждый акционер голосует согласно количеству имеющихся у него акций, но сами акции не отдает. Далее мы увидим, что все-таки страницы косвенно теряют некоторый PageRank.

Уравнение ясно показывает, откуда берется значение PageRank для любой страницы. Предположим, что у нас есть 2 страницы, A и B, какая ссылается друг на друга, никаких других ссылок на этих страницах нет. Вот что случается:

Шаг 1: Вычислим значение PageRank для страницы A

Страница теперь имеет новое значение PageRank. Для вычисления использован вес исходящей ссылки со страницы B. Но страница B также имеет исходящую ссылку на страницу A и полученное значение PageRank не может быть точным, пока не известно значение PageRank для страницы В.

Шаг 2: Вычислим значение PageRank для страницы B

Страница B теперь имеет новое значение PageRank, которое не может быть точным, поскольку для вычисления использовано неточное значение PageRank со страницы A.

Мы не можем вычислить точное значение PageRank для страницы A, пока мы не узнаем значение PageRank для страницы B, и мы не можем вычислить точное значение PageRank для страницы B, пока не узнаем значение PageRank для страницы A.

Можно снова и снова пересчитывать значение PageRank для страниц А и В, и каждый раз результат будет отличаться от предыдущего и будет неточным. Мы можем повторять вычисления снова, используя полученные на предыдущем этапе величины. Но мы всегда используем неточные значения для вычислений, так что результаты всегда будут неточными.

Преодолеть проблему можно, повторяя вычисления многократно. Всякий раз мы будем получать чуть более точные результаты. Фактически, точность не может быть достигнута никогда, поскольку вычисления всегда основаны на неточных исходных данных.

Рано или поздно мы достигнем точки, где дальнейшая итерация практически не будет влиять на результаты вычислений. Этим объясняется то, почему пересчет значений PageRank для всех страниц в Интернете у компании Google занимает так много времени и вычислительных ресурсов.

Мы можем четко быть уверены только в одном: ссылка из любого источника увеличивает показатели PageRank для нашего сайта.
Поделиться
Вход
Поиск по сайту
Игры
Легенда: Наследие Драконов
Регистрация
Мини-чат
Опросник
Оцените мой сайт
Всего ответов: 18
Статистика
Счетчик PR-CY.Rank
Каталог webplus.info
Онлайн всего: 1
Гостей: 1
Пользователей: 0

Ваш IP адрес:
18.188.61.223