python3.7脚本---爬取网页图片

#!/usr/bin/python

import re
import urllib
import urllib.request   #python3中urlopen、urlritrieve都在request库里面了,所以要导入此库

def htmlGet(url):
        page = urllib.request.urlopen(url)
        html = page.read()
        return html

def imgGet(html):
        res = r'src="(https.*?\.jpg)"'
        imgre = re.compile(res)
        imglist = re.findall(imgre,html.decode("utf-8")) #html不加后面的会报错typeerror,因为编码格式的变化,这里需要指定一下
        x = 0
        for i in imglist:
                urllib.request.urlretrieve(i,"%s.jpg" % x)
                x+=1

html = htmlGet("http://***")
imgGet(html)

本文题目:python3.7脚本---爬取网页图片
网站URL:http://bzwzjz.com/article/jipidp.html

其他资讯

Copyright © 2007-2020 广东宝晨空调科技有限公司 All Rights Reserved 粤ICP备2022107769号
友情链接: 定制网站制作 高端网站建设 自适应网站设计 网站建设开发 成都网站建设公司 成都网站制作 外贸网站设计方案 企业网站制作 四川成都网站制作 重庆电商网站建设 成都网站设计 企业网站设计 成都响应式网站建设 网站设计 网站建设推广 手机网站建设套餐 成都企业网站制作 营销网站建设 成都网站设计 LED网站设计方案 定制网站建设 网站制作公司