Canonical и другие мета теги

Теперь Яндекс как и Google, Yahoo и MSN поддерживает атрибут rel=”canonical”, факт, несомненно, положительный. Но как вообще поисковики относятся к содержанию мета тегов, к указаниям для поисковых роботов?
В разделе помощи для вебмастеров Яндекс перечисляет "методы управления поведением" робота Яндекса, но в их описаниях подчеркивает, что все указания МОГУТ учитываться или использоваться, т.е. не являются обязательными для поискового робота, например:

<meta name="keywords" content="..."/> — может учитываться при определении соответствия страницы поисковым запросам
meta name="description" content="..."/> — может использоваться в сниппетах (описаниях сайтов на странице результатов поиска)

Содержание (content) этих мета тегов должно помогать роботу описывать страницу сайта, но робот, видимо, проверяет соответствие указанных ключевых слов или описания содержанию страницы. Это вполне логично, ведь по ошибке или преднамеренно в keywords и description могут быть использованы ключевые слова, которые не релевантны, и пользователь напрасно будет искать их на странице.

canonical

Атрибут rel="canonical" мета тега <link> вебмастер может использовать, если на сайте есть "группы схожих по контенту страниц", т.е. страницы доступны по разным url. Чтобы избежать индексации дублей можно предпочитаемый (канонический) url, т.е. url страницы, которую вебмастер хочет видеть в результатах поиска, указать в разделе head страниц с неканоническими url.

Например, одна и та же страница с некоторыми отличиями содержимого или без отличий может открываться по url, которые содержат id сессий, переменные для сортировки и т.п.: www.сайт.ru/page50&category=2 или www.сайт.ru/page50&category=3.

<link rel="canonical" href="www.сайт.ru/page50">

Другой случай - одна и та же страница с url www.сайт.ru и сайт.ru.
Возможности атрибута canonical ограничены: "не рекомендуется создавать цепочки", т.е. если уж url указан как канонический, на странице с этим url не должно быть ссылки на другой канонический url, иначе смысл атрибута нивелируется.
Кроме того, каноническим может быть url только на том же домене. При переносе страниц на другой домен следует использовать постоянный редирект (301).
Также высказывается мнение, что редирект 301 надежнее использовать, если изменяются url страниц при смене движка, чтобы не потерять позиции в выдаче, т.е. полностью передать вес со старых.

noindex не работает?

Указание роботу в мета теге с name="robots" работает однозначно, например
<meta name="robots" content="noindex"/>
запрещает индексацию текста страницы,
content="nofollow" запрещает индексацию  и переходы по всем ссылкам на странице, а
content="none" или  content="noindex, nofollow" запрещает индексировать и то и другое.
Яндекс говорит, что ссылки на странице с nofollow не будут индексироваться, для робота они как бы не существуют.
Предполагается, что аналогично закрывает текст от индексации тег <noindex>, кстати его можно применять в формате

<!--noindex-->текст<!--/noindex-->

Закрывает ссылку атрибут rel="nofollow" в теге <a>:

<a href="url" rel="nofollow">текст ссылки</a>

Но здесь есть свои тонкости. Например, есть мнение, что (как показывают  эксперименты) тег noindex работает не всегда, например, работает, когда закрывает целый блок текста, а при попытке закрыть отдельные слова игнорируется. В чем дело?
Понятно, что страница, закрытая от индексации, просто не должна попадать в поисковую выдачу. Если в noindex закрыта часть текста, ситуация становится неоднозначной. Возможны случаи, когда в неиндексируемой части содержится действительно нежелательный текст, который делает нежелательной всю страницу в целом? Получается, что поисковик просто обязан читать и учитывать текст внутри noindex.
Источник – блог Яндекс.Поиска, 'Canonical и другие мета теги'

Опубликовано в рубрике Поисковые системы | с метками , , , , , , , . |

Еще записи

Один комментарий на «Canonical и другие мета теги»

  1. сервис продвижения сайтов говорит:

    А я сейчас обязательно подпишусь на такой блог!

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *