Crawler:反爬虫之基于urllib库+伪装浏览器方式实现从各种网站上(以百度贴吧为例)获得你喜欢的照片下载到本地电脑上
生活随笔
收集整理的这篇文章主要介绍了
Crawler:反爬虫之基于urllib库+伪装浏览器方式实现从各种网站上(以百度贴吧为例)获得你喜欢的照片下载到本地电脑上
小编觉得挺不错的,现在分享给大家,帮大家做个参考.
Crawler:反爬虫之基于urllib库+伪装浏览器方式实现从各种网站上(以百度贴吧为例)获得你喜欢的照片下载到本地电脑上
目录
输出结果
实现代码
输出结果
后期更新……
实现代码
import urllib.request<br>import re import osdef open_url(url):req=urllib.request.Request(url)req.add_header("User-Agent", "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.90 Safari/537.36 2345Explorer/9.2.1.17116")page=urllib.request.urlopen(req)html=page.read().decode("utf-8")return htmldef get_img(html):p=r'<img class="BDE_Image" src="([^"]+\.jpg)"'imglist=re.findall(p,html)for each in imglist: print(each)for each in imglist:filename=each.split("/")[-1] urllib.request.urlretrieve(each, filename,None)if __name__=="__mian__":url="http://tieba.baidu.com/p/3563409202" get_img(open_url(url)) url="http://tieba.baidu.com/p/3563409202" get_img(open_url(url))
相关文章
Py之Crawler:利用python的爬虫功能实现从各种网站上(以百度贴吧为例)获得你喜欢的照片下载到本地电脑上
总结
以上是生活随笔为你收集整理的Crawler:反爬虫之基于urllib库+伪装浏览器方式实现从各种网站上(以百度贴吧为例)获得你喜欢的照片下载到本地电脑上的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: Crawler:基于urllib库+实现
- 下一篇: Crawler:反爬虫机制之基于urll