1. 主页
  2. 文档
  3. 宝塔面板
  4. 宝塔面板问答
  5. 防火墙添加URL黑名单方法

防火墙添加URL黑名单方法

大家好,我是飞小优,很多seoer查看网站日志经常会发现一些无良蜘蛛抓取一些不相关的链接,而这些链接在你的网站中也不存在,这种现象着实很烦,那怎么解决?

爬虫访问的页面

基于URL连接结构,可以通过正则表达式来添加处理,从上图看,访问的是带有”/article-“字符串的以.html结尾的URL地址,那正则表达式可以写成如下格式:

^/article-.+$或者^/article-.+$

后台添加正则表达式URL规则

^/article-.+$/article-.+$ 的区别

  • ^/article-.+$:这个正则表达式会匹配以/article-开头,后面跟随任意字符直到行尾的URL。也就是说,它会匹配所有以/article-开头的URL,不管其扩展名是什么(例如 .html.asp.php等)。
  • /article-.+$:这个正则表达式也会匹配以/article-开头,后面跟随任意字符直到行尾的URL。注意这里缺少了^符号,这意味着它不仅会匹配以/article-开头的URL,还会匹配任何包含/article-的URL(无论它是否以/article-开头)。因此,这个表达式的范围比第一个表达式要广。

至于以.xx.html 或.xx.asp 或其他扩展名结尾的URL,它们属于正则表达式/article-.+$/xx.html$ 和/article-.+$/xx.asp$ 的范畴,这里的.xx表示任何以.开头的字符串,例如.html.asp等。不过,如果你想要匹配特定扩展名(如.html.asp),则应该使用以下正则表达式:

  • 对于.html^/article-.+\.(html)$
  • 对于.asp^/article-.+\.(asp)$

这样就能确保只匹配以.html.asp结尾的URL。以上就是飞优为大家介绍的通过添加URL黑名单禁止垃圾蜘蛛访问网站,这样做有利于SEO。

我们要如何帮助您?

发表回复

Please Login to Comment