首页服务器Web服务器 Nginx服务器屏蔽与禁止屏蔽网络爬虫的方法

Nginx服务器屏蔽与禁止屏蔽网络爬虫的方法

admin 2019-10-11 23:23:11 阅读() 评论()

每个网站通常都会遇到很多非搜索引擎的爬虫，这些爬虫大部分都是用于内容采集或是初学者所写，它们和搜索引擎的爬虫不一样，没有频率控制，往往会消耗大量服务器资源，导致带宽白白…

每个网站通常都会遇到很多非搜索引擎的爬虫，这些爬虫大部分都是用于内容采集或是初学者所写，它们和搜索引擎的爬虫不一样，没有频率控制，往往会消耗大量服务器资源，导致带宽白白浪费了。

其实Nginx可以非常容易地根据User-Agent过滤请求，我们只需要在需要URL入口位置通过一个简单的正则表达式就可以过滤不符合要求的爬虫请求：

location / {  if ($http_user_agent ~* "python|curl|java|wget|httpclient|okhttp") {    return 503;  }  # 其它正常配置  ...}

本文来自网络，不代表1号站长-站长学院|资讯交流平台立场。转载请注明出处： https://www.1cn.cc/fwq/web/2490.html

这里可以再内容模板定义一些文字和说明，也可以调用对应作者的简介！或者做一些网站的描述之类的文字或者HTML！