如何禁止浏览器爬虫

 时间:2026-02-18 06:22:38

1、(1)禁止所有搜索引擎访问网站的任何部分。User-agent: *Disallow: /

2、(2)允许所有的robots访问,无任何限制。User-agent: *Disallow:或者User-agent: *Allow: /还可以建立一个空文件robots.txt或者不建立robots.txt。

3、(3)仅禁止某个搜索引擎的访问(例如:百度baiduspider)User-agent: BaiduSpiderDisallow:/

4、(4)允许某个搜索引擎的访问(还是百度)User-agent: BaiduSpiderDisallow:User-agent: *Disallow: /这里需要注意,如果你还需要允许谷歌bot,那么也是在“User-agent: *”前面加上,而不是在“User-agent: *”后面。

5、(5)禁止Spider访问特定目录和特定文件(图片、压缩文件)。User-agent: *Disallow: /AAA.net/Disallow: /admin/Disallow: .jpg$Disallow: .rar$这样写之后,所有搜索引擎都不会访问这2个目录。需要注意的是对每一个目录必须分开说明,而不要写出“Disallow:/AAA.net/ /admin/”。

  • 小黑盒护眼模式怎么开启
  • 京东APP如何快速取消全部商品收藏
  • 怎么卸载win10隐藏程序
  • 关于雷神笔记本电脑一键重装win7的问题教程
  • H5加密加固的三个技巧
  • 热门搜索
    河南旅游景点排名前十 安徽省旅游局 北京旅游报价 银川旅游景点 周庄旅游攻略 上海邮轮旅游 上航旅游官网 南岳衡山旅游攻略 北京的旅游景点 大连旅游景点大全