Как
вы можете обнаружить, какой у страницы вес
Вы можете скачать тулбар
[toolbar, инструментальная линейка — прим.].
После инсталляции в верхней части Internet Explorer появится столбцовая
диаграмма, дающая интерпретацию веса PageRank для страницы, которую вы
в данный момент смотрите. Если вы задержите курсор мыши над диаграммой,
то увидите число от нуля до десяти. (Если вы не видите числа, возможно,
у вас установлена старая версия тулбара. Как только вы полностью его
деинсталлируете, перезагрузите компьютер и установите последнюю версию,
вы сможете видеть число.)
Насколько
точен тулбар Google
Тулбар Google показывает вес
сайта не очень точно, но это единственный инструмент, который может
дать вам прямо сейчас хоть какое-то представление. Поскольку вы знаете
ограничения тулбара, вы, по меньшей мере, знаете, что вы видите. Есть
два ограничения у тулбара Google:
- Временами
тулбар определяет вес приблизительно.
Если вы откроете страницу, которой нет в индексе Google, но есть
страница, очень близкая к ней в индексе, то тулбар отобразит свое
предположение о весе PageRank.
Эта догадка бесполезна для наших целей, потому что она не представлена
ни в каких вычислениях PageRank. Единственный способ выяснить,
использует ли тулбар догадку, это ввести URL в поисковую
форму Google и увидеть, появится ли страница. Если нет, значит, он
предполагает!
- Тулбар
дает только представление реального веса PageRank!
В то время как вес PageRank
линеен, они решили показывать его на нелинейной диаграмме. Так, для
тулбара, изменение веса PageRank от 2 до 3 занимает меньше увеличения
веса PageRank от 3 до 4. Это лучше всего иллюстрируется сравнительной
таблицей; настоящие числа хранятся в тайне, поэтому мы будем
использовать просто любые числа для иллюстрации:
Если
действительный вес PageRank между |
То
тулбар показывает |
0,00000001
и 5 |
1 |
6
и 25 |
2 |
26
и 125 |
3 |
126
и 625 |
4 |
626
и 3125 |
5 |
3126
и 15625 |
6 |
15626
и 78125 |
7 |
78126
и 390625 |
8 |
390626
и 1953125 |
9 |
1953126
и бесконечностью |
10 |
Надо надеяться, что вы можете
увидеть из этой иллюстрации, сколь ограничена информация, которую вы
получаете из тулбара.
С этого момента я собираюсь
использовать термин Настоящий PR для обозначения подлинного веса PageRank,
хранимого Google, и Тулбаровский PR для обозначения довольно скупого
представления того, что тулбар Google позволяет нам видеть.
Расчет
PageRank
Объяснив, что такое вес PageRank,
т. е., что вы узнаете, когда получаете информацию о нем, и
насколько он важен... в этом разделе я расскажу вам примерно как он
вычисляется. Знать это не обязательно, однако, если вы поймете это, вы
будете лучше понимать, как следует его применять.
Когда Google был только
исследовательским проектом, они [Брин и Пэйдж — прим.]
написали статью, подробно описывающую формулу, которая определяет вес PageRank
для страницы. Хотя они, возможно, уже не используют в точности эту
формулу, она представляется достаточно корректной для сегодняшних
целей. Вот она:
R(A) =
(1-d) + d (PR(T1)/C(T1) +
... + PR(Tn)/C(Tn)),
где
PR(A) — это вес PageRank страницы A (тот
вес, который мы хотим вычислить),
D —
это коэффициент затухания, который обычно устанавливают равным 0,85,
PR(T1) —
вес PageRank
страницы, указывающей на страницу A,
C(T1) —
число ссылок с этой страницы,
PR(Tn)/C(Tn)
означает, что мы делаем это для каждой страницы, указывающей на
страницу A
|
Жуть! Для тех из вас, кто не
является математиком, здесь есть полная информация по этой
формуле — вы не можете просто вычислить вес PageRank
за один прием, как показано тут. Чтобы вычислить вес PageRank
страницы A вам понадобится знать веса PageRank всех страниц,
указывающих на страницу A. Их веса PageRank будут частично
зависеть от страницы A, указывающей на них, либо каких-то
других страниц, ссылающихся на них. Какая глупая формула. Что она нам
говорит, так это одну очень важную вещь о весе PageRank любой страницы.
Вес
PageRank, передаваемый на страницу A со страницы B,
которая указывает на нее, уменьшается с каждой ссылкой куда-нибудь,
которая находится на странице B. Это означает, что вес
страницы, по существу, это мера ее голоса; страница может разделить
этот голос между одной, двумя или многими ссылками, но общая голосующая
сила будет всегда той же самой.
Сейчас забудьте формулу на
некоторое время, потому что легче рассмотреть пример реализации,
который очень похож на PageRank.
Он должен помочь нам лучше понять PageRank. Назовем его MiniRank.
Вначале мы не знаем, какие веса
MiniRank у этих страниц, поэтому мы их просто присвоим. Для простоты,
мы выберем число один. В результате диаграмма становится...
Все еще легко! Сейчас вспомните
правила передачи веса. Вначале мы применяем коэффициент затухания.
(Коэффициент затухания, в основном, говорит о том, что страница не
может голосовать так, чтобы другая страница была столь же важна, как
она сама. Это означает, что страницы, к которым труднее добраться в
Web, менее важны.) Затем мы делим сохранившийся вес на число ссылок. Мы
подсчитываем итоговый вес, который должен быть добавлен ко всем до
единой страницам, перед тем как мы окончательно его прибавим8.
Итак, глядя вначале на
страницу A, видим, что значение веса MiniRank, доступное для
передачи, после затухания равно 1 * 0,85 = 0,85. Со
страницы ведут две ссылки, поэтому, по окончании итерации, мы добавим
0,425 к весу MiniRank страницы B и 0,425 к весу MiniRank
страницы C. Мы не можем сделать это до тех пор, пока мы не
рассчитали все ссылки страницы, потому что это повлияет на результаты.
Перейдем к странице B.
Она содержит только одну ссылку. Поэтому, она передаст 1 *
0,85 = 0,85 странице C, когда мы сделаем все
вычисления для ссылок.
Страница C также имеет
одну ссылку. Поэтому она передаст вес 1 * 0,85 = 0,85
странице A.
Страница D имеет одну
ссылку, поэтому она передает 0,85 странице C.
Сейчас мы можем добавить все
суммы ко всем весам страниц.
Новые значения весов MiniRank
показывают, сколь важна страница C. Но мы еще не завершили.
Поскольку все страницы начали с одного значения, по правде говоря, мы
вычислили только популярность в ссылках (link popularity). Суть PageRank
и MiniRank такова, что страницам, на которые чаще ссылаются, следует
получить больше голосов; поэтому мы должны проделать то же самое еще
раз! На этот раз страница C имеет большее влияние, потому что
ее текущий вес MiniRank выше.
Так, посмотрим на
страницу A вначале. Ее текущий вес MiniRank равен 1,85.
Величина MiniRank, доступная для передачи, после применения затухания
составляет 1,85 * 0,85 = 1,5725. Есть две ссылки со
страницы, поэтому по завершению итерации мы добавим 0,78625 к весу
MiniRank страницы B и весу MiniRank страницы C.
Перейдем к странице B.
У нее есть только одна ссылка. Следовательно, она передаст
1,425 * 0,85 = 1,21125 странице C, когда мы
завершим все вычисления со ссылками.
Страница C также имеет
одну ссылку, но при этом обладает огромным весом 3,125 MiniRank.
Поэтому она передаст 3,125 * 0,85 = 2,65625
странице A.
Страница D имеет одну
ссылку, поэтому она передает 0,85 странице C.
Мы получаем....
Мы уже можем видеть то, что
следовало ожидать: страница C имеет наибольший вес MiniRank,
страница A — следующий по величине. На
практике нам нужно было бы повторить эти действия от 50 до
100 раз, чтобы гарантировать, что низкая точность предыдущих
итераций сведена на нет. Просто!
Источник Chris Ridings,
www.searchenginesystems.net
Источник: |