注册
 找回密码
 注册
江西广告网
查看: 251|回复: 0
打印 上一主题 下一主题

如何禁止雅虎搜索网站内容

[复制链接]

该用户从未签到

1
跳转到指定楼层
发表于 2009-1-15 08:34:47 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?注册

x
  按照雅虎官方的解释,如果我们想要禁止雅虎搜索网站内容,在我们的服务器的根目录中放置一个 robots.txt 文件,加入以下内容:   User-Agent: *   Disallow: /   因为以上是大部分网络搜索程序都会遵守的标准协议,加入这些协议后,不仅雅虎搜索无法抓取网站内容,其他搜索程序都不会再抓取我们的网络服务器或目录。   所以网智成建议您,应慎重选择,我们可以写成这样:   User-Agent: Googlebot   Disallow:   User-Agent: *   Disallow: /   这样写就是只有名为Googlebot的爬虫可以抓网站所有的内容,雅虎搜索和其他搜索引擎的爬虫都不能抓取网站的所有内容。   或者   User-agent: slurp   Disallow: /   只禁止雅虎的"slurp"搜索引擎蜘蛛的抓取。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表