网站首页>技术心得 >网站怎么防采集(中级防止采集的方法)

网站怎么防采集(中级防止采集的方法)

来源:白马号 · 发布时间:2022-11-19 10:45:27 · 所属栏目:技术心得

网站经常被别人采集,导致增加服务器压力消耗服务器资源影响网站收录与排名,这是我们防止别人采集网站文章的原因,下面白马号提供一些比较有效的防止方法,防止不能带来完全防止,但对于一些新手、中级采集者还是蛮有效果的。


1、封禁IP

封IP很简单,只需要知道采集者的采集IP,把IP加入黑名单即可,常见使用工个是宝塔防火墙有这个功能,或者CMS定制封禁插件(这个需要找人二次开发)。


2、去除列表分页页码

网站的首页和列表页都不要放出分页,因为采集大部份都是从列表分页来大部采集文章URL的,在调用时记得不要调用页分页页码即可,让别人采集获取文章URL路径。


3、去除内容页上下翻页

内容详情页我们经常看见过有上一篇下一篇,其实我们完全可以除去这个功能,对网站SEO的影响并不大,目前很多大型网站都是去除上下翻页的,他们的网站都没有影响,所以我们可以学哪些大型网站的做法。


4、文章URL规率

文章URL路径不要设置一些自增ID和年月日,别人一看就知道可以通过自增ID或年月日采集到文章URL,这个一定要注意了,如果条件允许找人开发个插件或URL规则生成不规率的地址即可,这样就能归避掉别人通过判断获取URL了。


5、访问频率判断封禁

服务器上安装防火墙(Apache\Ngnix)设置访问频次,在短时间内大量打开访问网页视为恶意访问将自动封禁访问网站,封闭时间自行设置即可。

文章推荐: