Просмотр полной версии : Robots.txt
Ruslan Aliev
24.06.2009, 12:00
Кто из веб-мастеров УзНета использует этот файлик?
Можно узнать для каких целей используете, какие параметры?
Я иногда использую на сайтах powered by WP, беру образец отсюда http://mywordpress.ru/faq/#anchor11
Ruslan Aliev
24.06.2009, 16:31
Я иногда использую на сайтах powered by WP, беру образец отсюда http://mywordpress.ru/faq/#anchor11
Спасибо за ответ.
Какой вы у себя выставили Crawl-Delay ?
Aleksey Kim
24.06.2009, 23:47
Какой вы у себя выставили Crawl-Delay ?
User-agent: *
Crawl-delay: 10
# Directories
Disallow: /cache/
Disallow: /include/
Disallow: /themes/
…
# Files
Disallow: /header.php
Disallow: /footer.php
…
Ruslan Aliev
25.06.2009, 08:58
Какой вы у себя выставили Crawl-Delay ?
User-agent: *
Crawl-delay: 10
# Directories
Disallow: /cache/
Disallow: /include/
Disallow: /themes/
…
# Files
Disallow: /header.php
Disallow: /footer.php
…
Вам я посоветовал еще упомянуть и ваш форум. В частности ссылки типа "Ответить" "Послать личное сообщение" - создают много мусора для поисковиков. Все эти ссылки для неавторизованного пользователя ведут на страницу с сообщением об ошибке. Но поисковики все равно их индексируют и тратят на это ресурсы... в том числе и ресурсы вашего сервера.
Пот пример ненужных ссылок.
http://forum.torg.uz/index.php?act=Post&CODE=02&f=32&t=12921&qpid=203319
http://forum.torg.uz/index.php?act=Post&CODE=02&f=32&t=12921&qpid=203329
http://forum.torg.uz/index.php?act=Post&CODE=02&f=32&t=12921&qpid=203342
Правда пока не могу посоветовать, что надо прописать в robots.txt чтобы исключить их из индексации.
Nodir Sharipov
25.06.2009, 10:38
Совет по настройке по Яндексу - http://help.yandex.ru/webmaster/?id=996567
По гуглу - http://www.google.com/support/webmasters/bin/answer.py?hl=ru&answer=40360
Ruslan Aliev
25.06.2009, 11:06
Для примера из 96676 страниц сайта yarmarka.uz доступных для поисковиков, 67605 страниц содержат параметр action=BUY - то есть являются ссылкой на страницу заказа товара. Для поисковиков это бесполезная информация.
Из 468144 страниц сайта torg.uz 71932 содержат параметр view=findpost - фактически это ссылка на пост в топике. Содержимое страницы выдаваемое по этой ссылке такое же как при ссылке на топик, проблема в том что в этом топике еще 19 ссылок на самого себя.
http://forum.torg.uz/index.php?showtopic=3243&view=findpost&p=66847 > http://forum.torg.uz/index.php?showtopic=3243&mode=linear
http://forum.torg.uz/index.php?showtopic=3243&view=findpost&p=66848 > http://forum.torg.uz/index.php?showtopic=3243&mode=linear
http://forum.torg.uz/index.php?showtopic=3243&view=findpost&p=66857 > http://forum.torg.uz/index.php?showtopic=3243&mode=linear
http://forum.torg.uz/index.php?showtopic=3243&view=findpost&p=66859 > http://forum.torg.uz/index.php?showtopic=3243&mode=linear
http://forum.torg.uz/index.php?showtopic=3243&view=findpost&p=70186 > http://forum.torg.uz/index.php?showtopic=3243&mode=linear
Aleksey Kim
15.07.2009, 00:39
Вам я посоветовал еще упомянуть и ваш форум. В частности ссылки типа "Ответить" "Послать личное сообщение" - создают много мусора для поисковиков. Все эти ссылки для неавторизованного пользователя ведут на страницу с сообщением об ошибке. Но поисковики все равно их индексируют и тратят на это ресурсы... в том числе и ресурсы вашего сервера.
Правда пока не могу посоветовать, что надо прописать в robots.txt чтобы исключить их из индексации.
Да, спасибо.
К форуму у меня вообще данного файла не оказалось, почему-то.
Сейчас добавил это
User-agent: *
Crawl-delay: 10
Disallow: /memberlist.php
Disallow: /ucp.php
Disallow: /faq.php
Disallow: /adm
Disallow: /posting.php
Disallow: /report.php
Disallow: /mcp.php
Disallow: /viewonline.php
Disallow: /search.php
Disallow: /cache
vBulletin® v3.8.5, Copyright ©2000-2025, Jelsoft Enterprises Ltd. Перевод: zCarot