Индексация: использование noindex, nofollow, robots и др.

На индексацию веб-страниц можно влиять по-разному. Кроме задания специальных директив в файле robots.txt используются noindex, nofollow, robots и др. элементы.

Тег noindex

Используется для запрета индексации части страницы, но учитывается только
поисковыми роботами Яндекса и Рамблера (Google его игнорирует)

<noindex>то, что нужно скрыть</noindex>

Атрибут rel=”nofollow”

Это атрибут тега <a>. Он не влияет на индексацию ссылки. Большинство
поисковиков (кроме Google) по ней переходит. Используется для того, чтобы сообщить поисковой системе, что рейтинг со страницы, на которой ссылка размещена, не должен передаваться по этой ссылке.

<a href="http://site.ru" rel="nofollow">Текст ссылки</a>

Это значит, что “закрывать” ссылку нужно так:

<noindex><a href="http://site.ru" rel="nofollow">Текст ссылки</a></noindex>

meta-тег

На странице meta-тег “robots” (как и все meta-теги) находится между тегами <head> и </head>. Он позволяет управлять индексацией всей страницы.

Инструкция для всех роботов:

<meta name="robots" content="значение">

Атрибут content может иметь значение

  • noindex – не индексировать
  • index -индексировать
  • nofollow- не следовать по ссылкам
  • follow- следовать по ссылкам
  • all – индексировать и следовать по ссылкам
  • none – не индексировать и не следовать по ссылкам
  • noimageindex – запретить индексирование картинок
  • noarchive – запретить выводить ссылку “Сохранено в кэше” (поисковики будут по-прежнему индексировать страницу и выводить ее фрагмент)
  • nosnippet – выводить выводить
    фрагменты страницы ( это текст, который поисковики показывают под названием страницы в результатах поиска ). При удалении фрагментов удаляются также и сохраненные в кэше страницы.

Допустимо указывать несколько значений через запятую:

<meta name="robots" content="noindex, nofollow">

Инструкция для робота Google

не индексировать картинки (ссылки будут индексироваться):

<meta name="googlebot" content="noimageindex">

Атрибут alt

Атрибут alt тега <a> задает альтернативный текст для изображения, который отображается в браузере, если не удается показать само изображение

<a href="http://site.ru"><img src="http://www.mysite.ru/image.gif" alt="Мой рисунок"/></a>

Поисковые системы запоминают значение атрибута alt при индексации страницы, но не используют его при ранжировании результатов поиска.

Известно, что Google учитывает текст атрибута alt только тех изображений, которые являются ссылками на другие страницы.

Когда используется зеркало сайта

Для того чтобы в поисковиках не было дублирования страниц с зеркала сайта, следует задать в meta-теге URL абсолютный адрес страницы, а на зеркале – абсолютный адрес страницы основного сайта.

<meta name="URL" content="абсолютный адрес страницы">

, , , , ,

  1. MBlogM
    Февраль 4th, 2010 at 21:36 | #1

    Все не так просто. Читайте СЕОшников!

    ссылки с Я.ру работают в плане увеличения позиций – факт, в плане поднятия ТИЦ – факт. (был эксперимент …

  2. дима
    Февраль 2nd, 2010 at 18:58 | #2

    Такой вопрос.
    meta-тег noindex, яндекс переходит по такой ссылке Текст ссылки, но не передает вес (тиц).

    Просто есть социалки, в которых ссылки закрыты в noindex, есть ли смысл оставлять в них сылки для быстрой индексации сайта?

    Заранее, спасибо за ответ.

  3. Pakhom
    Январь 8th, 2010 at 09:06 | #3

    Спасибо. Очень понравилось :)

  4. MBlogM
    Январь 7th, 2010 at 13:48 | #4

    В таких вопросах не претендуют на уникальность. Это памятка. В том числе и для себя.

  5. Miron
    Январь 7th, 2010 at 06:15 | #5

    Где-то я подобное читал. Ну или по крайней мере пишите очень похоже на Тему.

  1. Нет trackbacks.

Spam Protection by WP-SpamFree Plugin

Сидим, как в деревне! Ни радио, ни телевизора – один Интернет остался!