robots.txt для wordpress

20.05.10
Рубрика: Seo,Wp
Автор: Delet_ER

У меня есть пару друзей которые тоже ведут автономные блоги на WordPress.

И тоже начали не так давно.

Ну я вот вчера ночью сидел и анализировал их внутреннюю оптимизацию.

И пришел к выводу что некоторым из них нужна помощь)

Точнее не помощь а пару советов.

Ранее я уже рассказывал как настроить rss и  что потом с этим rss делать.

Теперь пришло видимо время рассмотреть файл robots.txt

И так.

файл robots.txt ( он кстати лежит в корне сайта ) нужен для создание «инструкций» поисковым роботам.

Если уж совсем по простому, то он объясняет поисковикам что можно индексировать а что нет.

Это ускоряет индексацию,  помогает избежать дублирование контента и не забивает поисковики «ненужным хламом» который они так не любят.

Конфигураций конечно может быть много.

Но я считаю что для WordPress подходит примерно следующая.

******

User-agent: Yandex
Allow: /wp-content/uploads/
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /xmlrpc.php
Disallow: /template.html
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /wp-trackback
Disallow: /wp-feed
Disallow: /wp-comments
Disallow: */trackback
Disallow: */feed
Disallow: */comments
Disallow: /tag
Disallow: /category
Disallow: /archive
Disallow: */trackback/
Disallow: */feed/
Disallow: */comments/
Disallow: /?feed=
Disallow: /?s=
Host: указываете ваш основной домен, с www он или без ( к примеру delexp.net )

User-agent: *
Allow: /wp-content/uploads/
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /xmlrpc.php
Disallow: /template.html
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /wp-trackback
Disallow: /wp-feed
Disallow: /wp-comments
Disallow: */trackback
Disallow: */feed
Disallow: */comments
Disallow: /tag
Disallow: /category
Disallow: /archive
Disallow: */trackback/
Disallow: */feed/
Disallow: */comments/
Disallow: /?feed=
Disallow: /?s=
Sitemap: http://вашсайт.ру/sitemap.xml

******

* я использую именно такой пример конфига. можете проверить http://delexp.net/robots.txt *
* эта версия конфига была выявлена экспериментальным путем – читать здесь и здесь

в принципе даже особо гуглить не надо что бы понять что запрещает этот конфиг.
он отрезает все лишнее и ничего больше.

просто создаете файл robots.txt копируете туда изложеное выше и кидаете в корневик блога.

все счастливы.

Захаров Вадим

Похожие записи:



Получайте обновления блога, в любой удобной для вас форме:
подписаться на emailподписаться на rss



Полезная запись? Тогда жми:
Метки:
 , ,


98 ответов в “robots.txt для wordpress”

  1. угу, а еще я закрыл вообще доступ некоторым ботам, ибо не фиг грузить сервер. А Yahoo имеет самого №%№% бота который приводит к чрезмерным нагрузкам на проц. А самое главное ни каких входов с их №;%:%? поисковика нет.

    Ответить

    Delet_ER Ответил:

    я кстати понял как можно увеличить количество рсс подписчиков.
    точнее понял как ты предлагал их «накрутить».

    вставить рсс в жж да?

    а это трафик даст?

    а то мне ударными темпами надо посещаемость поднимать.

    Ответить

    Дмитрий Ответил:

    а подскажи пж что ты понял? ))) для меня оч актуально

    Ответить

    Delet_ER Ответил:

    ну у нас там своя жж тема есть)

    но мы ей не пользуемся..
    как высянилось мертвые подписчики никому не нужны

    Ответить

  2. Я тупое блондинко :) не знаю, как вставить этот файл в корень блога )

    Ответить

    Delet_ER Ответил:

    ну ты как плагины туда заливала?
    вот так же. только прям в основную папку блога ( примерно так /www/ani-sanni.com/сюда )

    Ответить

    curiousolga Ответил:

    А конкретней можно? Вот открываю я коммандер, запускаю ftp-соединение…и что дальше? Там тьма папок, в каждой из них – еще по тьме…

    Ответить

    Delet_ER Ответил:

    ну у каждого хостинга по своему.

    у меня к примеру в папке www все мои сайты хранятся

    Ответить

    curiousolga Ответил:

    У меня таких папок, оказывается, две – www и WWW. Вроде обе оинаковые. Но файла роботс в корневом каталоге у обеих нет…Или ее создть надо мне самой?

    Ответить

    Delet_ER Ответил:

    ну ествественно.
    он же из воздуха не появится)

    Ответить

  3. да, что-то на подобии этого

    Ответить

  4. спасибо. как раз то, что я искал

    Ответить

  5. Сори за тупой вопрос, но звездочки копировать? :-) А то мало ли :-) Я в этих ШТМЛях ничего не понимаю, вдруг оно без звездочек не прочитает :-)

    Ответить

  6. последние которые?
    их не надо.
    остальное все надо

    надо обзор на твой блог сделать чтоли)
    а то ты у меня самый топовый комментатор

    Ответить

  7. Ой ё ёй.. мне еще такое рано :D

    Ответить

    Delet_ER Ответил:

    это надо было в самом начале делать)

    Ответить

  8. вот помощь мне точно не помешает

    Ответить

    Delet_ER Ответил:

    ну так давайте)

    Ответить

  9. Ни чего не поняла. Где и что создавать, где искать корневую папку. А можно написать инструкцию для полнейших чайников? Я даже в терминолигии не разбираюсь.

    Ответить

    Delet_ER Ответил:

    ну стукни в аську если хочешь.

    помогу чем смогу

    Ответить

    kladez-zolota Ответил:

    Кстати, не получаю ответы на свои коменты. Ответ вижу только, когда захожу сюда.
    А скайп есть? Я в скайпе – kladez_zolota

    Ответить

    Delet_ER Ответил:

    скайп не использую в этих целях.

    Ответить

    kladez-zolota Ответил:

    И есть вопрос, как сделать, чтобы приятать некоторые ссылки от поисковиков.

    Ответить

    Delet_ER Ответил:

    Атрибут rel=»nofollow» используется при формировании кода ссылки:

    текст ссылки

    Ответить

    kladez-zolota Ответил:

    Прости за мою тупость, а куда вставляется этот атрибут7

    Ответить

    Delet_ER Ответил:

    создаешь файл robots.txt вписываешь в него все что я указал.
    и суешь в ту папку, где у тебя хранится блог.
    прямо в корень

    Ответить

    kladez-zolota Ответил:

    Спасибо! Но к сожалению я ни чего не поняла.

    Ответить

    Delet_ER Ответил:

    Аська есть у тебя или нет?

    Ответить

    kladez-zolota Ответил:

    аськи нет

    Ответить

    Delet_ER Ответил:

    очень зря

    Ответить

  10. Приветствую всех не подскажете где найти файл хмл? у карты сайта Sitemap: http://адресвашегомапа.ру/сайтмап.хмл вот тут?

    Ответить

    Delet_ER Ответил:

    ну вначале его нужно создать.
    для этого используйте плагин.. подробнее тут – http://delexp.net/wordpress-plaginy/

    Ответить

    Тимур Ответил:

    я это видал =) как я понял оттуда надо взять Google XML Sitemaps этот плагин мне же надо эту карту для robots.txt

    Dagon Design Sitemap Generator- этот у меня уже стоит . Вообщем непонял я

    Ответить

    Delet_ER Ответил:

    ну.
    создай плагином xml карту..

    она появится у тебя по следующему пути http://mirkartofana.ru/sitemap.xml

    вот его и вставишь в роботс.тхт

    Ответить

  11. Большое спасибо. Щас закинул робота. вот только вопрос файл трекбэк случайно не нужно дописывать .php ?

    Ответить

    Delet_ER Ответил:

    да нет в принципе

    Ответить

  12. Очень пригодилось, первый раз столкнулся, помогло.

    Ответить

  13. спасибо, отличный пост + готовая инструкция :)

    Ответить

    Delet_ER Ответил:

    пожалуйста)

    Ответить

    Елена Ответил:

    Да не совсем готовая. Правила-то надо учитывать:

    Недопустимо наличие пустых переводов строки между директивами ‘User-agent’ и ‘Disallow’ (‘Allow’), а также между самими ‘Disallow’ (‘Allow’) директивами. Кроме того, в соответствии со стандартом перед каждой директивой ‘User-agent’ рекомендуется вставлять пустой перевод строки.

    Почему у вас в файле robots.txt все сплошняком идет?

    Ответить

    Дмитрий Ответил:

    а не могли бы вы источник дать… где об этом подробно почитать…

    Ответить

    Delet_ER Ответил:

    а зачем создавать лишние сложности и забивать головы людей, если и так все работает?

    http://i005.radikal.ru/1101/03/6caf1abd6311.jpg

    Ответить

  14. кстати по поводу последней строки – Sitemap: http://адресвашегомапа.ру/сайтмап.хмл
    если у меня стоит плагин google-sitemap-generator то эту строку все равно добавлять?
    они никак не пересекаются?

    Ответить

    Delet_ER Ответил:

    ну этот плагин делает карту сайта которую надо указать в роботс.тхт.. они работают в паре

    Ответить

  15. Вадик, а у меня есть эта вещь в блоге?? Нужна она мне??? Я вернула антиспам, у меня блогировало 2800 ссобщений, атака бла что ли на мой сайт??

    Ответить

    Delet_ER Ответил:

    нет просто спамеры.
    их много)

    http://www.domitalia.ru/robots.txt

    Ответить

  16. А такое роботс нормальный:
    User-agent: *
    Disallow: /wp-admin
    Disallow: /wp-includes
    Disallow: /wp-content/plugins
    Disallow: /wp-content/cache
    Disallow: /xmlrpc.php
    Disallow: /wp-content/uploads
    Disallow: /wp-content/themes
    Disallow: /trackback/
    Disallow: /tag/
    Disallow: /feed/
    Disallow: */*/feed/*/
    Disallow: */feed
    Disallow: */*/feed
    Disallow: /*?*
    Disallow: /?feed=
    Disallow: /?s=
    Sitemap: http://times.fireg.ru/sitemap.xml.gz
    Sitemap: http://times.fireg.ru/sitemap.xml

    User-agent: Yandex
    Disallow: /wp-admin
    Disallow: /wp-includes
    Disallow: /xmlrpc.php
    Disallow: /wp-content/uploads
    Disallow: /wp-content/plugins
    Disallow: /wp-content/cache
    Disallow: /wp-content/themes
    Disallow: /trackback/
    Disallow: /tag/
    Disallow: /feed/
    Disallow: */*/feed/*/
    Disallow: */feed
    Disallow: */*/feed
    Disallow: /?feed=
    Disallow: /*?*
    Disallow: /?s=
    Host: times.fireg.ru

    Можете подсказать пожалуйста.

    Ответить

    Delet_ER Ответил:

    уберите Sitemap: http://times.fireg.ru/sitemap.xml.gz

    ну и в принципе нормальный, только лишнего много.

    Ответить

    Дмитрий Ответил:

    А можно вопрос, почему убрать http://times.fireg.ru/sitemap.xml.gz и что лишнее можете подсказать пожалуйста.

    Ответить

    Delet_ER Ответил:

    а зачем оно вам там? у вас же там прописан .xml
    ну оно не лишнее, но в некоторых я не вижу смысла.
    но хуже оно не сделает)

    скоро будет небольшой эксперимент с robots.txt..
    можете подписаться и почитать.

    Ответить

  17. А если путь указанный в роботс, на самом деле в сайте отсутствует, он хуже не сделает? Или в этом случае поисковикам все равно на такие моменты?
    Да подпишусь, только ссылку дайти) А то до конца февраля в планах разобраться с роботс.

    Ответить

    Delet_ER Ответил:

    http://feeds.feedburner.com/delexp/del_exp – подписывайтесь)

    ну если ты закроешь от индексации несуществующую страницу, то хуже не станет.
    она же не существует и следовательно индексировать и так нечего)

    Ответить

  18. А можете посмотреть мой сайт, и посоветовать, что-то по оптимизации? Интересна точка зрения со стороны.

    Ответить

    Delet_ER Ответил:

    ну напишите на мыло.
    оно в контактах есть

    Ответить

  19. Спасибо за информацию!!!
    Готовая инструкция по созданию и установке robots.txt.
    Это мне точно не помешает, попробуем поэксперементировать…

    Ответить

    Delet_ER Ответил:

    пожалуйста.

    заглядывайте ещё)

    Ответить

  20. А можно вопрос, изменил роботс случайно поставил неправильный параметр, вылетели все страницы из яндекса, осталась 1 страница, а сколько понадобиться чтобы все страницы вернулись, а то уже 4 дня все также 1 страница, хоть и теперь все правильно.

    Ответить

    Delet_ER Ответил:

    вернется с выдачей.
    скорее всего уже вернулось)

    Ответить

  21. возвращаются только новые страницы, 3 создал, три проиндексировались, а старые пока нет, но жду.

    Ответить

    Delet_ER Ответил:

    вернуться.
    в любом случае, ну если уник конечн

    Ответить

  22. А host он только для Яндекса надо? Я просто не особо в курсе, но вроде по этому файлику выглядит будто для яндекса лишь

    Ответить

    Delet_ER Ответил:

    да гугль тоже эту директиву прочитает.

    но гугл очень долго обновляет изменения связанные с робот.тхт, иногда полгода может занимать.

    Ответить

    Akceptor Ответил:

    Мне не критично по времени. Просто хотел разобраться что к чему

    Ответить

    Delet_ER Ответил:

    ну если будут ещё вопросы, то заходите.
    а ещё лучше – подписывайтесь

    Ответить

    Akceptor Ответил:

    Уже :)

    Ответить

    Delet_ER Ответил:

    ну и хорошо :)

    Ответить

  23. если я зменю Host: на свой ну и соответственно url к каре сайта и вставлю в свой robots.txt то все будет оке?? он уже настроен?))

    Ответить

    Delet_ER Ответил:

    Да.
    именно так

    Ответить

  24. Доброго времени суток!

    У меня такой вопрос: задалась целью разобраться с этим роботсом, создла, залила в корень и резко упала посещалка, хз с этим связано или нет, но резкий скачек вниз насторожил, как быть, убрать роботса или потерпеть и все наладится, а может тупо разрешить все к индексации, т.к. жил сайт до этого год, все нормально было, а тут на тебе! :-(

    Ответить

    Delet_ER Ответил:

    ну видимо дублирующие страницы собирали трафик, а сейчас они выпали из индекса.

    если сайт прекрасно жил, то можно и разрешить

    Ответить

  25. Вроде нужно показать три вида карты сайта

    Ответить

    Delet_ER Ответил:

    нужно?
    нет не нужно.

    скорее можно сделать на «всякий случай», но я не вижу в этом смысла, так как в каждом сайтмапе есть ссылка на другой сайтмап

    Ответить

  26. в принципе не плохо, нго вот многие рекомендуют в роботсе прописывать сайтмап, в комментах также поднимался данный вопрорс, считаю что лишним не будет

    Ответить

    Delet_ER Ответил:

    ну пропишите, хуже не станет.
    а вообще у меня прописана хмл версия.

    Ответить

  27. Вадим, долго пыталась разобраться что к чему. Выяснила куда загружать роботс.
    Сам роботс тупо скопировала с предложенного вами, поменяла домен.
    Убрала Sitemap: http://вашсайт.ру/sitemap.xml – не понимаю, почему карту сайта не нужно чтоб поисковик смотрел? или вернуть эту строчку на место?

    И еще: у меня в комментариях ссылка комментатора (когда пишешь имя, как здесь irina-se) открыта а не нофоллу. А хотелось бы ее закрыть. При этом сам текст комментариев вроде как контент уникальный, он будет открыт или нет в предложенном роботс?

    Очень нужно ваше мнение, можете посмотреть пожалуйста?

    User-agent: Yandex
    Allow: /wp-content/uploads/
    Disallow: /wp-login.php
    Disallow: /wp-register.php
    Disallow: /xmlrpc.php
    Disallow: /template.html
    Disallow: /cgi-bin
    Disallow: /wp-admin
    Disallow: /wp-includes
    Disallow: /wp-content/plugins
    Disallow: /wp-content/cache
    Disallow: /wp-content/themes
    Disallow: /wp-trackback
    Disallow: /wp-feed
    Disallow: /wp-comments
    Disallow: */trackback
    Disallow: */feed
    Disallow: */comments
    Disallow: /tag
    Disallow: /category
    Disallow: /archive
    Disallow: */trackback/
    Disallow: */feed/
    Disallow: */comments/
    Disallow: /?feed=
    Disallow: /?s=
    Host: irina-se.com

    User-agent: *
    Allow: /wp-content/uploads/
    Disallow: /wp-login.php
    Disallow: /wp-register.php
    Disallow: /xmlrpc.php
    Disallow: /template.html
    Disallow: /cgi-bin
    Disallow: /wp-admin
    Disallow: /wp-includes
    Disallow: /wp-content/plugins
    Disallow: /wp-content/cache
    Disallow: /wp-content/themes
    Disallow: /wp-trackback
    Disallow: /wp-feed
    Disallow: /wp-comments
    Disallow: */trackback
    Disallow: */feed
    Disallow: */comments
    Disallow: /tag
    Disallow: /category
    Disallow: /archive
    Disallow: */trackback/
    Disallow: */feed/
    Disallow: */comments/
    Disallow: /?feed=
    Disallow: /?s=

    надеюсь на помощь

    Ответить

    Delet_ER Ответил:

    ну я видел ваше письмо в спаме

    Ответить

    Delet_ER Ответил:

    но карту вы зря убрали)

    Ответить

    irina-se Ответил:

    раз вы говорите что зря, значит не буду убирать ))
    еще раз – спасибо!

    Ответить

  28. Вадим, ответ получила, странно что письмо ушло в спам, надеюсь это ошибка.
    Большое-большое спасибо!

    Ответить

  29. А в чем смысл дублирования инструкций отдельно для Яндекса? Ведь User-agent: * применяется и к нему тоже. Яндекс.Помощь гласит:

    В самом robots.txt проверяется наличие записей, начинающихся с ‘User-agent:’, в них ищутся подстроки ‘Yandex’, либо ‘*’ (регистр значения не имеет).
    […]
    #Пример корректно составленного robots.txt, при обработке
    #которого директива Host учитывается
    User-Agent: *
    Disallow:
    Host: http://www.myhost.ru

    Ответить

    Delet_ER Ответил:

    ну это же яндекс.
    он неадекватен.

    поэтому для него прописывают отдельную дерективу.

    можете проверить мой robots.txt у яндекса. он верен

    Ответить

    Иван Ответил:

    А в чем конкретно он неадекватен и почему? Поясните, пожалуйста. Весь рунет завален одинаковыми примерами вроде вашего с дублированием для Яндекса, при этом никто не пишет (или не понимает) почему нужно делать именно так. Откуда это пошло, откуда информация о неадекватности? Яндекс сам в своем собственном разделе «Помощь» приводит примеры правильного robots.txt без User-agent: Yandex.

    Ответить

    Delet_ER Ответил:

    потому что раньше яндекс требовал «особую» дерективу.
    сейчас это уже не так обязательно, но все равно используется.

    Ответить

  30. А у меня нет robots.txt. Зачем захламлять и путать роботов. Они и так не будут ходить по техническим директориям. На них нет ссылок. Плагин xml sitemap строит виртуальный robots.txt. Там всего 3 строчки и по оценке Яндекса он без ошибок.

    Ответить

    Delet_ER Ответил:

    ну конечно он будет без ошибок.
    а что насчет дублей?

    Ответить

  31. Спасиб за пост, поставил себе этот robots.txt и теперь не парюсь насчет него)))

    Ответить

    Delet_ER Ответил:

    рад что был полезен)

    Ответить

  32. Огромное спасибо за правильный файл, я давно искал, что-то подобное.

    Ответить

  33. Интересно а почему Вы Disallow: /page/ не добавили?

    Ответить

  34. По-моему список раздут слишком, можно без проблем куда меньшим обойтись,а результат тот же. Хотя не помешает никогда все добавить, это понятно.

    Ответить

    Delet_ER Ответил:

    да ну он же не нагружает сервак.
    почему бы и не закрыть вообще все лишнее?

    Ответить

  35. Спасибо за статью! Долго не могла настроить robots.txt, а здесь все очень понятно написано!

    Ответить

  36. Вадим, а плагин All in one seo разве не решает проблему дуюлирования?
    И я не пойму, виртуальный роботс, который делает sitemap это не тот, который надо? Я в корне не нашла роботс – я так понимаю надо его все равно делать?

    Ответить

    Delet_ER Ответил:

    нет не решает, он лишь упрощает прописывание метатегов.

    какой виртуальный роботс?
    если вы про про плагин, который делает Sitemap, то к robots.txt он не имеет никакого отношения

    Ответить

  37. Писала писала, а тут абракадабра вышла.
    Вадим, папка public_html в FTP – в нее надо файл кидать
    И еще вопрос – плагин all in one seo не решает полностью проблемы дублирования контента?
    И что такое виртуальный роботс – не подскажите? когда я ввожу в командную строку браузера свой сайт/robots.txt – он открывается и я виду вот это:

    User-agent: *
    Disallow:

    Sitemap: http://hobby-terra.ru/sitemap.xml.gz

    Это что значит?

    Ответить

    Delet_ER Ответил:

    это значит что он есть, но никаких директив нем не прописано.
    лишь указана карта сайта

    Ответить

  38. Спасибо, я только настраиваю свой блог. Данный файлик очень пригодился!

    Ответить

  1. 1 Трекбэк(и)

  2. Подводные камни ранней монетизации | Записки опытного ЖЖшника

Комментировать

Подтвердите, что Вы не бот — выберите человечка с поднятой рукой: