Правильный robots.txt для JohnCMS

Здравствуйте. Прежде всего, хочу извиниться за столь долгую задержку между записями, к сожалению не было свободного времени.

А теперь перейдем к теме. Недавно я решил проверить, как обстоят дела с robots.txt на сайтах, использующих JohnCMS. Я воспользовался каталогом сайтов на wapstart: там есть категория, созданная специально для сайтов, построенных на JohnCMS. Пройдясь по первым двум десяткам ссылок результаты получились таковы: у более чем 60% ресурсов robots.txt не был обнаружен, у остальных 40% он содержал одну и более директив. Думаю, если провести более масштабные исследования, результаты существенно не изменятся.

Robots.txt это файл, к которому обращаются поисковые роботы при посещении Вашего сайта, дабы посмотреть, что не стоит включать в поисковую выдачу, а так же получить другие указания. Это файл является одним из важнейших при поисковой оптимизации сайта. Пока я решил составить robots.txt для системы управления контентом JohnCMS, который можно использовать в качестве шаблона. Возможно, в будущем я составлю подобные файлы с правилами и для других мобильных CMS.

User-agent: *
Disallow: /in.php
Disallow: /registration.php
Disallow: /str/smile.php
Disallow: /chat/
Disallow: /str/brd.php
Disallow: /forum/index.php?act=new
Disallow: /gallery/index.php?act=new
Disallow: /read.php?do=forumfaq
Disallow: /read.php?do=actmail

User-agent: Yandex
Disallow: /in.php
Disallow: /registration.php
Disallow: /str/smile.php
Disallow: /chat/
Disallow: /str/brd.php
Disallow: /forum/index.php?act=new
Disallow: /gallery/index.php?act=new
Disallow: /read.php?do=forumfaq
Disallow: /read.php?do=actmail
Host: yoursite.ru

Создайте файл robots.txt, вставьте туда эти строчки и загрузите в корневую директорию вашего сайта. И не забудьте изменить yoursite.ru на адрес вашего сайта!

Эти записи в robots.txt помогут исключить из индекса так называемый «поисковой мусор», то есть те страницы, которые не являются интересными для пользователей, ищущих что-либо. Сюда можно и даже нужно добавить свои страницы, которые не должны быть включены в поисковую выдачу, воспользовавшись директивой «Disallow:».

Метки: , ,

Оставить комментарий