爬虫下载文档的3种方法-创新互联

import urllib2,cookielib

成都创新互联公司2013年成立,先为芝罘等服务建站,芝罘等地企业,进行企业商务咨询服务。为芝罘企业网站制作PC+手机+微官网三网同步一站式服务解决您的所有建站问题。

url = 'http://www.baidu.com'

print "1"
response = urllib2.urlopen(url)
print response.getcode()
print len(response.read())

print "2"
request = urllib2.Request(url)
request.add_header("user-Agent","Mozilla/5.0")
response2 = urllib2.urlopen(request)
print response2.getcode()
print len(response2.read())

print "3"
cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
urllib2.install_opener(opener)
response3 = urllib2.urlopen(url)
print response3.getcode()
print cj
print response3.read()

另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。


名称栏目:爬虫下载文档的3种方法-创新互联
文章网址:http://bzwzjz.com/article/cdgjgs.html

其他资讯

Copyright © 2007-2020 广东宝晨空调科技有限公司 All Rights Reserved 粤ICP备2022107769号
友情链接: 成都网站设计 成都品牌网站设计 企业网站建设 企业网站建设 定制网站建设 网站建设方案 重庆手机网站建设 网站建设 成都网站设计制作公司 成都网站设计 成都网站建设 成都网站制作 网站建设公司 专业网站设计 成都网站建设 成都网站建设 企业网站制作 成都网站建设 成都网站设计 网站制作 高端网站建设 企业网站设计