当前位置：首页 > 编程语言 > python >内容正文

python

Python爬取网站用户手机号_设计师的福利，python爬取素材网站

发布时间：2025/3/20 python 50 豆豆

生活随笔收集整理的这篇文章主要介绍了 Python爬取网站用户手机号_设计师的福利，python爬取素材网站小编觉得挺不错的,现在分享给大家,帮大家做个参考.

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

基本环境配置

python 3.6
pycharm
requests
parsel

确定网站目标

基本常规操作，F12打开开发者工具，分析网页

网页返回的数据，都是一堆乱码，再写代码的时候可以转一下编码就好了
静态网页都是非常简单的，是可以直接抓取到自己想要的数据的

请求网页

import requestsimport reurl = 'http://www.sccnn.com/shiliangtuku/default({}).html'.format(page)headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'}response = requests.get(url=url, headers=headers)response.encoding = response.apparent_encoding

分析网页，解析数据

import parselr = re.findall('', response.text)urls = r[2:]for i in urls: page_url = 'http://www.sccnn.com' + i response_2 = requests.get(url=page_url, headers=headers) response_2.encoding = response_2.apparent_encoding selector = parsel.Selector(response_2.text) title = selector.css('#LeftBox h2::text').get() img_url = selector.css('#LeftBox .PhotoDiv img::attr(src)').get()

保存数据

def downlaod(title, url): path = 'D:pythondemo素材网站img' + title + '.jpg' response = requests.get(url=url, headers=headers) with open(path, mode='wb') as f: f.write(response.content) print('正在下载{}'.format(title))

实现效果

完整项目代码后台私信小编01获取！

总结

以上是生活随笔为你收集整理的Python爬取网站用户手机号_设计师的福利，python爬取素材网站的全部内容，希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错，欢迎将生活随笔推荐给好友。

上一篇：如何判断数组所有数都不等于一个数_【每日
下一篇： python中try_python中tr