大家好,我是飞小优,很多seoer查看网站日志经常会发现一些无良蜘蛛抓取一些不相关的链接,而这些链接在你的网站中也不存在,这种现象着实很烦,那怎么解决?
基于URL连接结构,可以通过正则表达式来添加处理,从上图看,访问的是带有”/article-
“字符串的以.html
结尾的URL地址,那正则表达式可以写成如下格式:
^/article-.+$
或者^/article-.+$
^/article-.+$
与/article-.+$
的区别
^/article-.+$
:这个正则表达式会匹配以/article-
开头,后面跟随任意字符直到行尾的URL。也就是说,它会匹配所有以/article-
开头的URL,不管其扩展名是什么(例如.html
,.asp
,.php
等)。/article-.+$
:这个正则表达式也会匹配以/article-
开头,后面跟随任意字符直到行尾的URL。注意这里缺少了^
符号,这意味着它不仅会匹配以/article-
开头的URL,还会匹配任何包含/article-
的URL(无论它是否以/article-
开头)。因此,这个表达式的范围比第一个表达式要广。
至于以.xx.html
或.xx.asp
或其他扩展名结尾的URL,它们属于正则表达式/article-.+$/xx.html$
和/article-.+$/xx.asp$
的范畴,这里的.xx
表示任何以.
开头的字符串,例如.html
, .asp
等。不过,如果你想要匹配特定扩展名(如.html
或.asp
),则应该使用以下正则表达式:
- 对于
.html
:^/article-.+\.(html)$
- 对于
.asp
:^/article-.+\.(asp)$
这样就能确保只匹配以.html
或.asp
结尾的URL。以上就是飞优为大家介绍的通过添加URL黑名单禁止垃圾蜘蛛访问网站,这样做有利于SEO。