Интернет Маркетинг Review

Internet - это то место, где можно зарабатывать деньги*

Наш сайт рассказывает, как это сделать.

* - речь не идет о сетевом маркетинге и тому подобных "серых" схемах. Мы говорим здесь только о том, как Ваш сайт сможет приносить прибыль.

Главная  -  Статьи  -  Мнения  -  Лучшие сайты мира  -  Учебник по продвижению  -  Полезные файлы  -  Поиск  -  Форум  -

Тематические разделы сайта:

Что такое PageRank (ПэйджРанк) Google 'а и как получить его по максимуму

 

Причина, по которой появилась эта статья

Не так давно мне попалась на глаза одна широко известная статья «Что такое ПэйджРанк», к которой большинство людей обращается, когда хочет уяснить для себя вопрос — что такое ПэйджРанк, и как он работает. Если честно, то я и сам ей пользовался. Однако, когда я писал Калькулятор ПэйджРанка, мне пришло в голову, что эта статья неверна с точки зрения производимых вычислений. В ней используется своя собственная форма ПэйджРанка, которую автор называет «мини-ранк». Мини-ранк, по непонятным причинам, использует формулу, отличную от Гугловского ПэйджРанка, из-за чего результаты вычислений становятся неверными.

Несмотря на то, что в результате написания этой и последующей статей автор отрицает мини-ранк, оригинальная статья о мини-ранке остается в интернете. Поэтому, если вам известна статья «Что такое ПэйджРанк», то лучше о ней забыть.

 

Что же такое ПэйджРанк?

ПэйджРанк представляет собой численное значение, которое отражает, насколько значима данная страница в интернете. Гугл полагает, что когда одна страница ссылается на другую, она словно «отдает свой голос» за другую страницу. Тогда, чем больше голосов отдано за страницу, тем важнее эта страница должна быть. Кроме того, — и это важно! — «отданные голоса» отличаются по значимости в зависимости от того, «кто» голосует. Гугл подсчитывает важность оцениваемой страницы, исходя из «голосов», отданных за нее. При этом в процессе производства расчетов Гугл учитывает, насколько важен (весом) каждый из отданных «голосов».

Таким образом, ПэйджРанк Гугла — это его собственный способ определения важности оцениваемой страницы. Это весьма важно, потому что ПэйджРанк является одним из факторов, определяющих порядок вывода результатов поиска. Это не единственный фактор, который Гугл использует для оценки страниц, но один из важнейших.

Начиная с этого момента, мы будем использовать термин «ПэйджРанк» в сокращенной форме как «PR».

 

Примечания:

Далеко не все ссылки учитываются Гуглом. Так, Гугл жестко отфильтровывает ссылки, имеющиеся на известных «фермах ссылок» (специально созданных совокупностях веб-документов, искусственно созданных для увеличения «веса» тех или иных веб-ресурсов). Некоторые ссылки даже приводят к «наказанию» страницы, на которую они ведут, со стороны Гугла. Понятно, что вебмастера не могут контролировать, какие сайты ссылаются на их сайты, но они должны понимать, какие ссылки они сами проставляют на другие сайты. По этой причине, ссылки, проставленные внутри одного отдельно взятого сайта, не могут ему навредить, тогда как ссылки, ведущие вовне сайта, могут быть «вредными», если они ведут на «наказанные» сайты. Поэтому будьте осторожны, когда ставите ссылки на внешние ресурсы. Если PR сайта составляет 0, то это обычно следует в результате наказания, и будет недальновидно проставлять ссылку на такой сайт.

 

Как рассчитывается ПэйджРанк?

При расчете ПэйджРанка страницы, учитываются все входящие (ведущие на нее) ссылки. Это ссылки, ведущие на нее изнутри сайта, и ссылки, ведущие на нее извне сайта.


PR(A) = (1-d) + d(PR(t1)/C(t1) + … + PR(tn)/C(tn))


Вот по этому уравнению и рассчитывается ПэйджРанк. Именно эта формула для расчетов была опубликована, когда расчет ПэйджРанка только вводился в эксплуатацию. Вполне возможно, что к настоящему времени формула претерпела целый ряд модификаций, однако Гугл в открытой печати об этом не сообщал. Однако, это не суть важно, поскольку само исходное уравнение достаточно хорошо.

В этом уравнении «t1 — tn» — это страницы, ссылающиеся на страницу A, «C» — количество выходящих вовне ссылок, а «d» — демпфирующий фактор, которому обычно присваивается значение 0.85.

Мы можем записать его в более простом виде:

ПэйджРанк страницы A = 0.15 + 0.85 * («доля» ПэйджРанка каждой страницы, которая ссылается на нашу страницу A)

где «доля» есть ни что иное как ПэйджРанк ссылающихся на страницу A других страниц разделенный на количество выходящих со страницы ссылок.

Страница «голосует» частичкой своего ПэйджРанка за каждую страницу, на которую она ссылается. Доля ПэйджРанка, которая передается в процессе «голосования», немногим меньше собственного ПэйджРанка этой страницы (а именно — значение собственного ПэйджРанка * 0.85). Это значение равномерно делится между всеми страницами, на которые стоят ссылки с данной страницы.

Исходя из этого, мы можем заключить, что ссылка со страницы, имеющей PR 4 и 5 выходящих вовне ссылок, хуже, чем ссылка со страницы с PR 8 и 100 выходящими вовне ссылками. ПэйджРанк страницы, которая ссылается на вашу, важен. Однако количество ссылок на этой странице, которая ссылается на вас, также важно. Чем больше внешних ссылок находится на ссылающейся на вас странице, тем меньшее количество ПэйджРанка ваша страница получит от нее.

Если «шаг» между значениями ПэйджРанка PR 1, PR 2…… PR 10 один и тот же, то приведенное выше заключение справедливо. Однако многие считают, что значения, лежащие между PR 1 и PR 10 изменяются по логарифмической шкале, и существуют веские причины, чтобы считать это правдой. Никто за пределами Гугла не знает наверняка, какое утверждение справедливо — первое или второе, — но очень велики шансы, что шкала именно логарифмическая, или схожая с последней. Коль скоро так, это означает, что, для того чтобы добраться до более высокого уровня ПэйджРанка, требуется значительно больше абсолютного значения, чем потребовалось странице, чтобы добраться до предыдущей градации. Тогда, предыдущее заключение приобретает прямо противоположный смысл: ссылка со страницы, имеющей PR 8 и множество выходящих вовне ссылок, хуже, чем ссылка со страницы, имеющей PR 4 и всего несколько выходящих вовне ссылок.

Вне зависимости от того, какой шкалой на самом деле пользуется Гугл, нам четко ясна одна вещь, а именно: ссылка с внешнего сайта изменяет ПэйджРанк вашего сайта. Помните об этом во избежание получения ссылок с «ферм ссылок».

Следует особо отметить, что когда страница «голосует» своим значением ПэйджРанка за другие страницы, ее собственное значение ПэйджРанка не понижается на размер значения, которым она «голосует». Значение ПэйджРанка не отдается вовне. Просто происходит процесс «голосования» в соответствии с весом ПэйджРанка того, кто голосует. Это как на собрании акционеров компании, когда каждый акционер голосует в соответствии с размером своего пакета акций; однако, при этом размер пакета акций не изменяется. Однако, страницы теряют часть своего значения ПэйджРанка непрямым путем, как мы увидим несколько позже.

Все ясно? Отлично. А теперь обратимся к вопросу о том, как на самом деле производятся вычисления.

При каждом расчете ПэйджРанка страницы ее существующий ПэйджРанк обнуляется, и расчеты производятся заново. Это делается потому, что за время, прошедшее с последнего вычисления, количество и качество ссылок, входящих извне на страницу, могло претерпеть изменения.

Из приведенного нами выше уравнения вполне понятно, как получается значение ПэйджРанка для страницы. Однако, существуют определенные тонкости. Представим себе, что у нас есть две страницы, A и B, каждая из которых ссылается на другую, и больше на них нет никаких ссылок. Тогда получается следующее:
Шаг 1: Расчет ПэйджРанка страницы A по весу входящих на нее ссылок

У страницы A теперь имеется новое значение ПэйджРанка. В расчетах используется значение для ссылки, входящей со страницы B. Но страница B, как мы уже говорили, тоже имеет входящую извне ссылку (со страницы A), а ее новое значение ПэйджРанка еще не рассчитано. Поэтому новое значение ПэйджРанка для страницы A базируется на неточных данных, и поэтому само не может быть точным.
Шаг 2: Расчет ПэйджРанка страницы B по весу входящих на нее ссылок

У страницы B теперь имеется новое значение ПэйджРанка. Но оно не может быть точным, потому что при его расчете используется новое значение ПэйджРанка, превходящее от ведущей извне ссылки со страницы A, которое неточно.

Это ситуация из «Уловки-22». Мы не можем получить значение ПэйджРанка для страницы A, пока нам не будет достоверно известно значение ПэйджРанка для страницы B; и мы не можем получить значение ПэйджРанка для страницы B, пока нам не будет достоверно известно значение ПэйджРанка для страницы A.

Теперь, если для обеих страниц мы имеем вновь рассчитанные значения ПэйджРанка, достаточно ли нам запустить вычисления вновь, чтобы получить корректный результат? Нет, не достаточно. Мы можем запускать вычисления снова и снова, базируясь на все более точных результатах, но эти результаты никогда не будут полностью точными, и, следовательно, наши финальные подсчеты будут неточными всегда.

Проблема решается неоднократными повторами процесса вычисления. С каждым разом при вычислениях получаются все более и более точные значения. На самом деле, получить точные значения невозможно, однако, пройдя от 40 до 50 последовательных итераций, мы приходим к ситуации, когда последующие дополнительные итерации не дают существенной добавки к точности вычисленных значений. Именно таким путем и идет Гугл при производстве каждой корректировки; и именно поэтому корректировка занимает так много времени.

Всегда следует помнить, что при производстве вычислений получается относительный (пропорциональный) результат. Получаемые результаты затем откладываются на шкале, принцип градуировки которой достоверно точно известен лишь самому Гуглу, и только после этого получается текущее значение ПэйджРанка для каждой страницы. Но даже и в таких условиях, мы можем пользоваться расчетами, чтобы понять распределение ПэйджРанка внутри сайта и ответить на вопрос, почему одни страницы сайта имеют более высокое значение ПэйджРанка, нежели другие.
 

 

Примечания:

Вы, возможно, слышали версию о том, что все считается именно так, как мы отмечали выше, но при каждой итерации результаты складываются с предшествующими значениями вычислений ПэйджРанка. Новое значение (результат + предшествующий ПэйджРанк) затем якобы используется когда происходит вычисление передачи ПэйджРанка другим страницам. Эта версия неверна по следующим причинам:

1. Они используют то же самое уравнение, но в измененном виде:

с PR(A) = (1-d) + d(……) на PR(A) = PR(A) + (1-d) + d(……)

Это и неверно, и не нужно.


2. Мы рассмотрим вопрос о том, как строить ссылки таким образом, чтобы некоторые страницы получали большую долю ПэйджРанка, чем остальные. В процессе вычислительных итераций имеет место добавление к существующему ПэйджРанку страницы других значений, нежели следует из опубликованного уравнения. А, поскольку это так, то добавления производятся по другому алгоритму и уравнение, о котором идет речь, неверно.

В соответствии с опубликованным уравнением, расчеты по каждой странице начинаются с самого начала при каждой вычислительной итерации. Результат зависит исключительно от входящих ссылок. Идея «добавления к существующему ПэйджРанку» не позволяет делать этого, поэтому получаемые таким путем результаты всегда неверны.

 

 

Свисающие ссылки

«Свисающие ссылки представляют собой такие ссылки, которые ведут на страницу, с которой нет ни одной выходящей ссылки. Они приносят ущерб модели, поскольку непонятно, каким образом перераспределяется их вес. А таких ссылок — великое множество. Часто эти свисающие ссылки ведут на страницы, которые мы никогда еще не загружали. Поскольку свисающие ссылки не влияют на оценку ПэйджРанка других страниц непосредственным образом, мы просто удаляем их из системы до тех пор, пока все расчеты ПэйджРанка не будут произведены. Когда же расчеты завершены, все величины ПэйджРанка известны, эти ссылки снова добавляются в базу и уже не влияют на порядок вещей существенным образом», — так звучит выдержка из оригинального документа о ПэйджРанке, написанного основателями Гугла Сергеем Брином и Лоренсом Пэйджем.

Итак, свисающая ссылка — это ссылка, ведущая на страницу, которая не имеет выходящих с нее ссылок, или ссылка на страницу, которую Гугл не индексирует. В обоих случаях, Гугл удаляет такую ссылку из базы сразу после начала процесса расчетов ПэйджРанка, и возвращает ее незадолго до того, как расчет заканчивается. Тогда влияние таких ссылок на результаты расчета ПэйджРанка минимально.

Результаты, показанные в примере 1 (правая диаграмма — здесь см. диаграмму вверху (Прим. Перев.)), неверны, поскольку страница B не имеет ссылок, выходящих с нее, и поэтому ссылка со страницы A на страницу B является свисающей, и должна быть удалена из расчетов. Поэтому в результате расчетов окажется, что все три страницы имеют PR поровну, а именно 0.15.

Возможно, в целях повышения функциональности конкретного сайта, можно проставлять ссылки на страницы, которые не имеют выходных ссылок, причем делать это без потерь ПэйджРанка, но это опасно с точки зрения снижения потенциального ПэйджРанка. Взглянем вот на этот пример. Потенциальное значение для этого сайта составляет 5, поскольку он содержит 5 страниц, но без вовлечения страницы E, сайт достигает лишь значения 4.15.

А теперь проставим ссылку со страницы A на страницу E и нажмем Calculate. Отметим, что суммарное значение снижается весьма достоверно. Однако, поскольку новая ссылка является свисающей, и будет удалена из расчетов, мы можем пренебречь новым суммарным значением и считать предшествующее 4.15 правдой. Таково влияние полезных с точки зрения функциональности свисающих ссылок. Они не влекут за собой потери суммарного ПэйджРанка.

Однако, кое-что, тем не менее, теряется, поэтому поставим ссылку со страницы E назад на страницу A и нажмем Calculate. Теперь мы имеем максимальное значение ПэйджРанка, которое возможно для 5 страниц. Ничего не потеряно.

Несмотря на то, что с точки зрения удобства функционала неплохо ставить ссылки на страницы внутри сайта без их возврата, это опасно с точки зрения падения ПэйджРанка. Именно поэтому всегда следите за тем, чтобы каждая страница внутри сайта ссылалась по меньшей мере на одну страницу в пределах того же самого сайта.
 


Входящие ссылки

Входящие ссылки (ссылки, ведущие на сайт извне) служат одним из путей увеличения суммарного ПэйджРанка сайта. Другой путь — это добавление страниц внутри сайта. Неважно, откуда пришли входящие ссылки. Гугл полагает, что веб-мастер не может контролировать, какие сторонние сайты ставят ссылки на его сайт, поэтому «наказания» за такие ссылки нет. Существуют и исключения из данного правила, однако они весьма редки и не являются предметом рассмотрения этой статьи.

ПэйджРанк ссылающейся на вас страницы важен, но не менее важно количество ссылок, ведущих со ссылающейся страницы. Так, если у вас есть только одна ссылка со страницы, имеющей PR 2, вы получите добавку в 0.15 + 0.85(2/1) = 1.85 для вашего сайта, в то время как ссылка со страницы, имеющей PR 8, имеющей 99 других ссылок, увеличит ПэйджРанк вашего сайта на 0.15 + 0.85(7/100) = 0.2095. Так что же, ссылка со страницы с PR 2 лучше — или нет? Взглянем сюда, чтобы понять возможную причину, почему это не так.

Коль скоро вашему сайту добавляется ПэйджРанк, расчеты запускаются снова, и ПэйджРанк каждой страницы изменяется. В зависимости от внутренней ссылочной структуры, ПэйджРанк некоторых страниц растет, некоторых — остается неизменным, но ни одна из страниц не теряет в ПэйджРанке.

Очень полезно иметь входящие ссылки на те страницы, с которыми вы прицельно работаете с целью увеличения их веса ПэйджРанка. А вот добавка ПэйджРанка любым другим страницам будет перераспределяться внутри сайта через систему внутренних ссылок. При этом важные страницы тоже будут испытывать повышение, но в гораздо меньшей степени, чем если бы ссылки вели на них непосредственно. Страница, на которую ведет входящая ссылка, получает наибольший эффект.

Достаточно легко представить себе свой сайт как небольшую самодостаточную сеть страниц. Когда мы подсчитываем значение ПэйджРанка, мы имеем дело с нашей небольшой сетью. Если мы проставляем ссылку на другой сайт, мы теряем какую-то часть ПэйджРанка нашей сети, а если мы получаем входящую ссылку, она добавляет некоторое значение к ПэйджРанку нашей сети. В роде бы так должна работать наша модель. Но не все так просто. Дело в том, что при расчете ПэйджРанка существует только одна сеть — и она содержит каждую страницу, которая зачтена Гуглом в его индексе. Каждая вычислительная итерация проводится для всей сети, а не для отдельных веб-сайтов.

Поскольку внутри этой сети существует огромное количество взаимных ссылок, и при этом каждая страница и каждая ссылка играют роль в процессе каждой итерации, невозможно рассчитать количественное влияние входящих ссылок на наш сайт с какой-либо достоверной точностью.

 

Выходящие ссылки

Выходящие ссылки играют роль дренажной системы для суммарного ПэйджРанка сайта. Через них ПэйджРанк утекает с сайта. Чтобы остановить этот процесс, попытайтесь сделать так, чтобы выходящие ссылки были реципрокными (взаимными). В связи с тем, что ПэйджРанк страниц с другого конца внешней ссылки различен, и с этих страниц, в свою очередь, существуют другие ссылки, то взаимные ссылки могут как увеличивать, так и уменьшать ПэйджРанк. Следует быть весьма осторожным, когда вы выбираете, с кем обмениваться ссылками.

Когда ПэйджРанк утекает с сайта через ссылку на другой сайт, то потери происходят через всю структуру ссылок. Этого может не быть заметно при первой вычислительной итерации, но это так. Причем, в зависимости от индивидуальных характеристик сайта, на который проставлена выходящая ссылка, зависит, какие из ваших страниц понесут максимальные потери доли ПэйджРанка. Без специализированного программного обеспечения достоверно просчитать ситуацию невозможно, но в целом — ссылку нужно ставить со страницы с наименьшим ПэйджРанком.

Многие сайты содержат ряд выходящих ссылок, которые не влияют на ПэйджРанк. К сожалению, все «нормальные» выходящие ссылки ведут к утечке ПэйджРанка. Однако, существуют «изощренные» пути создания выходящих ссылок, которые не сопровождаются утечками. ПэйджРанк утекает тогда, когда Гугл распознает ссылку на другой сайт. Решение проблемы заключается в том, чтобы использовать ссылки, которые Гугл не может отследить или распознать. Это в полной мере относится к формам и ссылкам, содержащим javascript.

 

Формы

Атрибут формы «action» не нуждается в том чтобы быть URL формы скрипта-парсера. Он может указывать на любую html-страницу любого сайта. Попробуйте сделать так.

Пример:
<form name="myform" action="http://www.domain.com/somepage.html">
<a href="javascript:document.myform.submit()">Click here</a>

Чтобы все было максимально цинично, атрибут должен быть написан в специальном javascript-коде, отличающемся от кода формы тэга, и при этом подгружаться из файла с расширением «js», который находится в директории, вход в которую запрещен Гугловскому роботу по директиве, находящейся в файле robots.txt.
 

 

Javascript

Пример:
<a href="javascript:goto('wherever')">Click here</a>

Здесь код javascript, содержащий URL, подгружается из отдельного файла с расширением «js», и если файл находится в директории, запрещенной к индексированию Гуглом, то все работает.

Итак, сколько дополнительного ПэйджРанка нам нужно, чтобы подвинуть ленточку на тулбаре?
Прежде всего, позвольте мне пояснить более детально, почему цифры, появляющиеся на тулбаре Гугла, не являются реальными значениями ПэйджРанка. В соответствии с основной формулой, и по данным выступлений основателей Гугла, миллиарды страниц интернета имеют средний вес ПэйджРанка порядка 1.0 на страницу. Таким образом, общий ПэйджРанк интернета эквивалентен количеству страниц на вебе, умноженному на 1, что в масштабах всего интернета дает огромное количество ПэйджРанка, распределяемого внутри всего интернета.

Шкала на тулбаре Гугла градуирована от 1 до 10. (Иногда там можно увидеть и 0, но эта цифра не является результатом вычислений ПэйджРанка). Гугл поступает таким образом, что делит полное реальное значение всего ПэйджРанка всего интернета на 10 частей. При этом каждая часть отображается значением, указанным на тулбаре. Таким образом, значения на тулбаре указывают лишь на то, в каком диапазоне находится ПэйджРанк доставленной браузером страницы, а не выводит точного значения ПэйджРанка самого по себе. Цифры на тулбаре — всего лишь относительные отметки.

Эквивалентны ли эти 10 отрезков или нет — все это предмет для дискуссий; Гугл на эту тему не распространяется. Однако, поскольку из практики известно, что, чем в более высоком диапазоне находится выводимый показатель, тем все более трудно добиться его дальнейшего повышения, многие люди (включая и меня самого) полагают, что градуировка производится по логарифмической шкале, или на очень похожем принципе, но уж никак не на основе простой линейной закономерности.

Давайте предположим, что используется логарифмическая закономерность, базирующаяся на десятичной шкале, и что требуется 10 правильно организованных с точки зрения ссылочных структур, страниц, чтобы поднять важную страницу сайта на одно деление шкалы тулбара. Тогда для следующей подвижки потребуется уже 100 новых страниц, 1,000 новых страниц, чтобы пройти следующее деление, 10, 000 — для еще одной подвижки, и так далее. Вот почему передвижения внизу шкалы (левый край) даются гораздо легче, чем в центре, и, тем более, на правом краю шкалы.

На самом деле, навряд ли основание логарифма составляет ровно 10. Некоторые исследователи считают, что это 5 или 6, а, возможно, даже и менее. Но даже и в этом случае, чем выше поднимаешься по шкале — тем более затрудненным становится процесс перемещения.

Примем во внимание, что, по мере того как количество страниц в интернете постоянно возрастает, суммарный ПэйджРанк также растет. А, коль скоро растет суммарный ПэйджРанк, расположение позиций градуировки шкалы должно меняться. При этом некоторые страницы опускаются на указателе тулбара по «непонятным» причинам. Если актуальное значение ПэйджРанка страницы было чуть-чуть выше какого-то деления шкалы, то добавление новых страниц в пространстве интернета должно вызывать незначительное перемещение маркера деления вверх; при этом положение страницы должно незначительно сползать вниз по шкале, оказываясь немного под соответствующим делением. Индекс Гугла постоянно растет, и они переоценивают значимость каждой из страниц с периодичностью, близкой к ежемесячной. Этот процесс известен как «Танец Гугла». Когда танец заканчивается, некоторые страницы падают относительно соответствующей отметки тулбара. Поэтому, «вливание» в массив мирового интернета новых страниц — зачастую это все что нужно, чтобы откатиться на позицию назад после очередного «танца».

Конечно, цифра, выводимая на тулбар — это хороший индикатор ПэйджРанка страницы, но все, о чем она свидетельствует, так это о том, что ПэйджРанк данной страницы находится в определенном диапазоне по отношению ко всему пространству шкалы. Так, PR 5 может означать, что страница не дотягивает до реального значения в 5, а также — что страница имеет больше 5, но пока не дотягивает до 6.
 

 

Доменные имена и имена файлов

С точки зрения робота, www.domain.com/, domain.com/, www.domain.com/index.html и domain.com/index.html — это разные URL-ы, и, следовательно, разные страницы. Люди посещают домашнюю страницу сайта, не делая различий между URL-ами, но для роботов все по-другому; и этот фактор влияет на результаты расчетов ПэйджРанка. Поэтому лучшим решением служит стандартизация обращения к URL-у, который вы используете для домашней страницы. Если же этого не сделать, то каждый URL будет обладать собственным ПэйджРанком вместо того чтобы укреплять ПэйджРанк одного-единственного URL-а.

Если вы задумаетесь над этим, как может робот знать имя файла страницы, которая выдается при подаче запроса в форме www.domain.com/? Да никак. Имя файла может быть index.html, index.htm, index.php, default.html, и так далее. Паук об этом не знает. Если вы внутри сайта проставляете ссылку на index.html, паук может сравнить две страницы, но и то это вряд ли будет произведено. Итак, получается два URL-а, и каждый из них получает свой ПэйджРанк от входящих ссылок. Стандартизация обращения к URL-ам домашней страницы позволяет быть уверенным, что не происходит распыления ПэйджРанка между основным URL-ом и URL-ами-«призраками».

Пример: Зайдите ко мне на UK Holidays and UK Holiday Accoommodation site (http://www.holidays.org.uk/) — хотя бы за такой длинный текст ссылки ;). Обратите внимание, что URL в адресной строке браузера содержит «www.». Если у вас инсталлирован тулбар Гугла, вы увидите, что PR этой страницы составляет 5. А теперь удалите «www.» из адреса и повторите запрос страницы. На этот раз отобразится PR 1, и это для одной и той же страницы. PR 1 — это достойный ПэйджРанк для спрятанной страницы, выводимой в составе фрейма.

Когда я только начинал написание этой статьи, URL-адрес, не содержащий «www.», имел PR 4 в связи с тем, что внутри сайта использовались различные версии синтаксиса ссылок. Это приводило к тому, что ПэйджРанк распределялся между двумя страницами, и, соответственно, между двумя сайтами. Это не самый лучший выход. С тех пор, я исправил внутренние ссылки, что привело к снижению PR не содержащей «www.» версии до 1 и нахождению большей доли ПэйджРанка в версии, содержащей «www.». Хотя, возможно и обратное решение, когда большая доля ПэйджРанка будет концентрироваться в версии, не содержащей «www.».

Представьте себе страницу, имеющую адрес www.domain.com/index.html. Индексная страница содержит ссылки на ряд относительных URL-ов, названных как products.html и details.html. Робот видит эти URL-ы как www.domain.com/products.html и www.domain.com/details.html. А теперь давайте добавим на другую страницу URL не в относительном, а в абсолютном формате, но опустим префикс «www.»: domain.com/anotherpage.html. Эта страница имеет ссылку назад на страницу index.html; таким образом, робот видит индексную страницу уже как domain.com/index.html. Несмотря на то, что это та же самая индексная страница, для паука — это совсем другая страница, поскольку она расположена на другом домене. Теперь смотрите, что получается. Каждый из относительных URL-ов на индексной странице также отличается, поскольку принадлежит к домену с именем domain.com/. В результате, ссылочная структура приводит к потере потенциального ПэйджРанка сайта из-за его распыления между страницами-«призраками».
Добавление новых страниц

При добавлении новых страниц возможны отрицательные последствия. Возьмем прекрасный благополучный сайт. Он имеет ряд входящих с других сайтов ссылок, а его страницы имеют определенные значения ПэйджРанка. Затем на сайт добавляется новая страница, имеющая ссылки на одну или более уже существующих страниц. Новая страница будет, безусловно, отнимать ПэйджРанк у уже существующих страниц сайта. В результате, хотя общий ПэйджРанк сайта возрастает, хотя бы одна или несколько ранее существовавших страниц испытают уменьшение ПэйджРанка в связи с тем, что новая страница возьмет от них часть значения ПэйджРанка. Таким образом, чем больше новых страниц мы добавляем на сайт, тем существеннее потери ПэйджРанка у страниц, уже существующих. В случае больших сайтов этот эффект малозаметен, но при небольшом количестве страниц потери могут быть существенными.

Иными словами, добавление новых страниц увеличивает суммарный ПэйджРанк сайта, но вызывает снижение индивидуального ПэйджРанка отдельных страниц. Решением проблемы служит постановка ссылок на новые страницы таким образом, чтобы не страдали важные страницы.
 


Тулбар Гугла

Если в вашем браузере установлен тулбар Гугла, вы можете видеть ПэйджРанк каждой загружаемой в браузер страницы. Но ПэйджРанк будет выводиться далеко не каждый раз. Многие страницы не были проиндексированы Гуглом и, соответственно, не имеют вычисленного значения ПэйджРанка. А другие страницы на том же сайте — были проиндексированы и имеют значение ПэйджРанка. Что же происходит в этом случае? Значения ПэйджРанка для не проиндексированных страниц выводятся «на лету» — самым приблизительным образом, и только для вашего тулбара. В этой ситуации — цифра есть, а ПэйджРанка нет.

Об этом важно помнить, дабы избежать обмена ссылками со страницами, которые на самом деле не имеют никакого ПэйджРанка сами по себе. Перед тем, как обмениваться ссылками, зайдите непосредственно на Гугл, и убедитесь, что страница, с которой вы планируете осуществить обмен, действительно проиндексирована.
 

 

Поддиректории

Некоторые полагают, что Гугл присваивает ПэйджРанк странице в зависимости от того, на каком уровне поддиректории она находится — точнее, понижает значение на единицу в зависимости от глубины нахождения директории. Так, если уровень PR для корневой директории составляет 4, то для вложенной директории это будет около 3, для следующего уровня вложения — около 2, и так далее. Другие же (включая меня) не принимают эту точку зрения вообще. Хотя, поскольку некоторые роботы имеют привычку избегать глубоких вложенных поддиректорий, будет правильным не делать структуру директорий чересчур глубокой — вполне достаточно иметь один или два уровня глубины, считая от корневого уровня.

 

ODP и Yahoo!

Была такая мысль, что Гугл усиливает ПэйджРанк для сайтов, прописанных в Yahoo! и ODP (a.k.a. DMOZ), но на сегодня, похоже, что это не совсем так. Действительно, такой факт имеет место, но, похоже, по совсем иной причине.

Роботы Гугла обходят эти директории точно так же, как и любой другой сайт, причем сайты, содержащиеся в этих директориях, имеют неплохие значения ПэйджРанка, поскольку обладают хорошими входящими на них ссылками. В случае ODP, директория Гугла представляет собой копию директории ODP. Каждый раз, когда в директорию ODP добавляются новые сайты (или исчезают старые), то же самое происходит и с директорией Гугла при ее следующем обновлении. Вход в директорию Гугла очень хороший, ПэйджРанк увеличивается, количество входящих ссылок, соответственно, тоже. Кроме того, данные из ODP используются для поиска на бесчисленном количестве сайтов — а это ведет к увеличению количества входящих ссылок.

Размещение в ODP бесплатно, но, поскольку сайты, стоящие в очереди на размещение, отсматриваются вручную, то с момента постановки в очередь на размещение до момента реального размещения проходит много времени. Поэтому, чем быстрее сайт будет поставлен в очередь на размещение, тем лучше. Полезные советы по подаче сайтов на размещение в DMOZ смотрите в этой статье о DMOZ.



Оригинал: www.webworkshop.net/pagerank.html
Источник перевода: www.bdbd.ru
Автор: Фил Крэйвен
Переводчик: Михаил Зуев

 

 

Самые интересные материалы: 

 

Сайт

Реклама в Интернет

Поисковая оптимизация, SEO

Прямой маркетинг (direct marketing)

Компании

Информация проекта IMRV, новости

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Реклама на сайте IMRV

Контакты

Друзья проекта IMRV

Карта сайта (site map)

Copyrights

click here