Python3爬虫里Splash负载均衡配置的方法-创新互联

创新互联www.cdcxhl.cn八线动态BGP香港云服务器提供商,新人活动买多久送多久,划算不套路!

创新互联建站专注为客户提供全方位的互联网综合服务,包含不限于成都网站设计、成都网站制作、泸水网络推广、微信小程序开发、泸水网络营销、泸水企业策划、泸水品牌公关、搜索引擎seo、人物专访、企业宣传片、企业代运营等,从售前售中售后,我们都将竭诚为您服务,您的肯定,是我们大的嘉奖;创新互联建站为所有大学生创业者提供泸水建站搭建服务,24小时服务热线:18980820575,官方网址:www.cdcxhl.com

小编给大家分享一下Python3爬虫里Splash负载均衡配置的方法,希望大家阅读完这篇文章后大所收获,下面让我们一起去探讨吧!

用Splash做页面抓取时,如果爬取的量非常大,任务非常多,用一个Splash服务来处理的话,未免压力太大了,此时可以考虑搭建一个负载均衡器来把压力分散到各个服务器上。这相当于多台机器多个服务共同参与任务的处理,可以减小单个Splash服务的压力。

1. 配置Splash服务

要搭建Splash负载均衡,首先要有多个Splash服务。假如这里在4台远程主机的8050端口上都开启了Splash服务,它们的服务地址分别为41.159.27.223:8050、41.159.27.221:8050、41.159.27.9:8050和41.159.117.119:8050,这4个服务完全一致,都是通过Docker的Splash镜像开启的。访问其中任何一个服务时,都可以使用Splash服务。

2. 配置负载均衡

接下来,可以选用任意一台带有公网IP的主机来配置负载均衡。首先,在这台主机上装好Nginx,然后修改Nginx的配置文件nginx.conf,添加如下内容:

http {
    upstream splash {
        least_conn;
        server 41.159.27.223:8050;
        server 41.159.27.221:8050;
        server 41.159.27.9:8050;
        server 41.159.117.119:8050;
    }
    server {
        listen 8050;
        location / {
            proxy_pass http://splash;
        }
    }
}

网站栏目:Python3爬虫里Splash负载均衡配置的方法-创新互联
网站链接:http://bzwzjz.com/article/deiisj.html

其他资讯

Copyright © 2007-2020 广东宝晨空调科技有限公司 All Rights Reserved 粤ICP备2022107769号
友情链接: 成都网站建设公司 重庆网站建设 上市集团网站建设 重庆企业网站建设 广安网站设计 成都响应式网站建设公司 营销网站建设 定制网站设计 成都网站制作 重庆手机网站建设 成都品牌网站设计 高端网站设计 成都网站设计 定制网站设计 网站建设改版 达州网站设计 成都网站建设 成都网站设计 成都网站建设 重庆网站建设 成都网站建设 网站设计