什么是robots.txt文件?
搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信息。
您可以在您的网站中创建一个纯文本文件robots.txt,在这个文件中声明该网站中不想被robot访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容。
返回页首
robots.txt文件放在哪里?
robots.txt文件应该放在网站根目录下。举例来说,当robots访问一个网站(比如"这样的记录出现. User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /~joe/
返回页首
robots.txt文件参考资料
robots.txt文件的更具体设置,请参看以下链接:
· Web Server Administrator' s Guide to the Robots Exclusion Protocol
· HTML Author' s Guide to the Robots Exclusion Protocol
· The original 1994 protocol description, as currently deployed
· The revised Internet-Draft specification, which is not yet completed or implemented