Дубли в WordPress. Часть 2

2 комментария

Дубли WordPress

Ранее я рассказывала о том, как убрать дубли страниц блога на Wordpress, а также была статья, напрямую связанная с данной темой — это удаление постоянных ссылок на картинки. Хочу сделать небольшое добавление ко всему сказанному. Если Вы почитаете в интернете посты некоторых известных блоггеров про то, как убрать дубли в WordPress из поисковой выдачи, то поймете, что разговор выходит довольно длинный   , и это действительно так. Даже того, что было проделано в указанных статьях данного блога, недостаточно, чтобы полностью убрать лишний контент из поиска. Т.е. все это работает, но не до конца.

Разобьем сегодняшнюю задачу на части.

  1. Удаление ненужного заголовка
  2. Форматирование комментариев
  3. Маленькая правка редиректа страниц с картинками
  4. Работа со страницами с пагинацией

Пройдемся по каждой из них.

Удаление ненужного заголовка

Вот казалось бы, мы пишем новые статьи, отвечаем комментаторам, ставим ссылки на свой блог, прописываем title к картинкам, везде где надо и не надо, но… что-то все равно идет не так, как хотелось бы. Работает все не совсем так, как ожидалось. Гугл нас весело индексирует, думаешь, куда ж он на этот раз впихнет ссылку на проиндексированную страницу… А Яндекс как-то не спешит. Нет, он сам по себе тормознутый неспешный. Может это еще не все?

Так вот было замечено, что автоматически добавляемый к ответу сервера заголовок rel=shortlink Яндекс не любит. Дубль по ней не создается, так как у Вас наверняка прописаны canonical для страниц, да и если вбить ссылку, которая приходит в заголовке (сейчас покажу), в яндексовский сервис «Проверка ответа сервера«, то ответом является 301 Moved Permanently. Видимо, Яндекс воспринимает это как мусор на странице, который ему не нравится.

Чтобы его увидеть, переходим по ссылке выше и в строку URL копируем адрес какой-нибудь страницы нашего блога и нажимаем кнопку «Проверить».

rel=shortlink

Мы видим, что заголовок отдается. Но у меня на блоге установлен плагин кэширования, поэтому следующий тычок по кнопке отдает несколько другой набор заголовков, что видно на картинке ниже, так что имейте это ввиду при тестировании.

rel=shortlink плагин кэширования блога

Чтобы отключить этот заголовок, открываем файл /wp-content / themes / ваша-тема / fuctions.php и пишем перед символами ?> всего одну строчку:

Сохраняем файл, чистим кэш, если такой плагин у Вас используется, и видим, что заголовок исчез.

Форматирование комментариев

Тут придется поработать побольше, саму проблему стоит разделить на более мелкие кусочки.

  1. Преобразование ссылки на сайт комментатора в тег span
  2. Решение проблемы replytocom
  3. Что делать с #comment ?

Возьмем с данного блога форму готового комментария и пронумеруем, к чему относятся данные проблемы.

format-comments

Преобразование ссылки на сайт комментатора в тег span

Несмотря на то, что все URL сайтов комментаторов по умолчанию снабжены атрибутом rel=’external nofollow’, держать открытыми данные URL не есть гуд. Но убирать их совсем тоже нет никакого смысла, поскольку добрую часть ценных комментаторов с блога Вы уберете.

Не будем скрывать, что многие блоггеры оставляют комментарии на других блогах не только для того, чтобы просто оставить отзыв о работе, проделанной автором статьи, но и чтобы на том сайте появилась ссылочка на блог комментатора, по которой можно тыкнуть. Иными словами, комментатор привлекает на свой блог  других людей с Вашего сайта. Увы, не будет и такой возможности, скорее всего, и комментариев почти не будет. Поэтому мы оставим возможность перейти на сайт комментатора, но саму ссылку «<a href..» уберем.

Напомню, что у меня шаблон Reverie, необязательно, что код, приведенный ниже, непременно подойдет Вам, нужно лишь понять смысл происходящего  . Открываем все тот же файл fuctions.php Вашей темы и перед тегом ?> пишем:

Данный код элементы одного массива ($cut) заменяет элементами другого массива ($insert). Везде в интернете Вы найдете данный код, в котором в каждом из этих массивов 4 элемента, то есть последний заменяемый элемент в ссылке на сайт комментатора был rel=’external nofollow’. Но дело в том, что в моем шаблоне в теге «<a href » содержался некий класс «url». Когда я применила код из интернетов  , на меня начал ругаться валидатор кода html, что, мол, у тебя указаны два класса («url» и «commenturl») вместо одного. Нивапрос! Добавляем пятый член в оба массива, таким образом, атрибут class=’url’ заменяется на «». Теперь все работает.

Решение проблемы дублей replytocom

Честно говоря, мне тут и добавить нечего, просто дам ссылку на блог SEO Маяк, где подробно описано, как сделать так, чтобы при щелчке на «Ответить» форма ответа выводилась скриптом, встроенным в WordPress, а сам этот элемент страницы перестал быть ссылкой. Если этого не сделать, то мы получаем в поисковых системах кучу дублей replytocom. И все наши труды по продвижению блога будут выброшены. Поисковики дубли все-таки не любят.

Лично я использовала метод добавления функции в файл functions.php, так что можете нажать сочетание клавиш Ctrl + F на странице блога SEO Маяк, скопировать туда имя этого файла, первое его упоминание на странице блога как раз встречается в нужном нам абзаце  .

Что делать с #comment ?

Если Вы наведете курсор мыши на дату выпуска комментария, он изображен на рисунке выше, то увидите, что это ссылка, имеющая вид http://наш_сайт/… /#comment-230.

И сколько есть комментариев, столько подобных ссылок у Вас будет. Что же с ними делать, скажете Вы?!

Ссылка в комментариях

 

Ответ: ничего!

Ничего, так как с точки зрения поисковых систем это не дубли, это якори для улучшения навигации по странице. Конечно, если Вы очень захотите, Вы можете удалить эту ссылку, но делать это совсем не обязательно, пусть будет  .

Маленькая правка редиректа страниц с картинками

Если картинки, на которые были постоянные ссылки, все же попали в индекс поисковых систем, то они оттуда нескоро пропадут. По моему опыту, если прописать 301 редирект на них, они начнут массово исчезать из индекса примерно через месяц-два. Раньше ждать чудес не стоит.

Выпадение страниц из индекса

В статье про удаление постоянных ссылок на картинки я приводила некий скрипт, в котором были прописаны редиректы для страниц с картинками. Когда я стала смотреть ответ сервера на некоторые, все же проскочившие в индекс гугла, страницы с картинками, то обнаружила, что некоторые из них отдают 302 редирект. Такие страницы могут висеть очень долго, так как поисковая система надеется, что может быть страничка еще «очухается», так как недаром данный редирект носит название «временный».

Поэтому открываем файл /wp-content / plugins / attachment-pages-redirect / attachment-pages-redirect.php и, если мы столкнулись с подобной ситуацией, просто меняем в функции sar_attachment_redirect строчку

на

После внесенных изменений ответ сервера на те страницы с картинками, которые отдавали 302 редирект, сменился на 301.

Не стоит этого делать, если все страницы с картинками отдают 301 редирект, это лишнее.

Работа со страницами с пагинацией

Подразумевается, что плагин All in One SEO у Вас уже установлен  . Если установлено что-то другое, то, думаю, можно и тот плагин настроить по аналогии.

Для начала немного расскажу о том, откуда тут берутся дубли.

Если ничего не настраивать, то ссылки

http://noservice.ru/page/1/

и

http://noservice.ru/

будут разными. Они будут индексироваться поисковыми системами, как разные страницы, и, если у Вас контент главной страницы совпадает с контентом страницы, открывающейся по адресу http://noservice.ru/page/1/, то получаются дубли.

В атрибут canonical по умолчанию запишется адрес записи блога + номер страницы, начиная со второй. Т.е. для url  http://noservice.ru/page/2 в атрибуте «canonical» было записано http://noservice.ru/page/2.

Поэтому идем в настройки All in One SEO и обязательно ставим галочку напротив пункта «Запретить пагинацию для канонических URL».

Запретить пагинацию для канонических URL

Так как часть из таких страниц уже могли попасть в индекс поисковых систем, то мы должны поставить галочку напротив пункта «Использовать noindex для страниц/записей с пагинацией».

Использовать noindex для страниц/записей с пагинацией

Итог

Вроде бы мы разобрались с тем, откуда появляются дубли страниц блога и с тем, как эти дубли убрать из поисковой выдачи. Однако, если они все же проползли в индекс, придется ждать месяц-другой, а если их очень много, то значительно дольше, пока они полностью выпадут из выдачи. Но в любом случае рано или поздно наступит день без дублей!

убрать дубли страниц

2 комментария “Дубли в WordPress. Часть 2”

  1. seoonly.ru

    Фух)) У меня вроде чистенько

    Ответить
    • Admin

      Это замечательно http://noservice.ru/wp-content/plugins/wp-monalisa/icons/wpml_rose.gif. Рада за Вас!

      Имхо основная неприятность этих дублей такова, что в индекс гугла они влетают как мухи, а вот на то, чтобы они оттуда исчезли, требуются месяцы…

      Удачи Вам в развитии блога! http://noservice.ru/wp-content/plugins/wp-monalisa/icons/wpml_bye.gif

      Ответить

Оставьте комментарий

XHTML: Вы можете использовать следующие теги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url=""> <img src="" alt="" class="" width="" height="">

http://noservice.ru/wp-content/plugins/wp-monalisa/icons/ab.gif 
http://noservice.ru/wp-content/plugins/wp-monalisa/icons/ac.gif 
http://noservice.ru/wp-content/plugins/wp-monalisa/icons/ag.gif 
http://noservice.ru/wp-content/plugins/wp-monalisa/icons/ah.gif 
http://noservice.ru/wp-content/plugins/wp-monalisa/icons/ai.gif 
http://noservice.ru/wp-content/plugins/wp-monalisa/icons/ak.gif 
http://noservice.ru/wp-content/plugins/wp-monalisa/icons/am.gif 
http://noservice.ru/wp-content/plugins/wp-monalisa/icons/an.gif 
http://noservice.ru/wp-content/plugins/wp-monalisa/icons/ao.gif 
http://noservice.ru/wp-content/plugins/wp-monalisa/icons/aq.gif 
http://noservice.ru/wp-content/plugins/wp-monalisa/icons/ar.gif 
http://noservice.ru/wp-content/plugins/wp-monalisa/icons/at.gif 
http://noservice.ru/wp-content/plugins/wp-monalisa/icons/av.gif 
http://noservice.ru/wp-content/plugins/wp-monalisa/icons/aw.gif 
http://noservice.ru/wp-content/plugins/wp-monalisa/icons/ay.gif 
http://noservice.ru/wp-content/plugins/wp-monalisa/icons/az.gif 
http://noservice.ru/wp-content/plugins/wp-monalisa/icons/bb.gif 
http://noservice.ru/wp-content/plugins/wp-monalisa/icons/bc.gif 
http://noservice.ru/wp-content/plugins/wp-monalisa/icons/bd.gif 
http://noservice.ru/wp-content/plugins/wp-monalisa/icons/be.gif 
больше...