欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程语言 > python >内容正文

python

Python爬取网站用户手机号_设计师的福利,python爬取素材网站

发布时间:2025/3/20 python 50 豆豆
生活随笔 收集整理的这篇文章主要介绍了 Python爬取网站用户手机号_设计师的福利,python爬取素材网站 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

基本环境配置

  • python 3.6
  • pycharm
  • requests
  • parsel

相关模块pip安装即可

确定网站目标


基本常规操作,F12打开开发者工具,分析网页


网页返回的数据 ,都是一堆乱码,再写代码的时候可以转一下编码就好了
静态网页都是非常简单的,是可以直接抓取到自己想要的数据的

请求网页

import requestsimport reurl = 'http://www.sccnn.com/shiliangtuku/default({}).html'.format(page)headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'}response = requests.get(url=url, headers=headers)response.encoding = response.apparent_encoding

分析网页,解析数据

import parselr = re.findall('', response.text)urls = r[2:]for i in urls: page_url = 'http://www.sccnn.com' + i response_2 = requests.get(url=page_url, headers=headers) response_2.encoding = response_2.apparent_encoding selector = parsel.Selector(response_2.text) title = selector.css('#LeftBox h2::text').get() img_url = selector.css('#LeftBox .PhotoDiv img::attr(src)').get()

保存数据

def downlaod(title, url): path = 'D:pythondemo素材网站img' + title + '.jpg' response = requests.get(url=url, headers=headers) with open(path, mode='wb') as f: f.write(response.content) print('正在下载{}'.format(title))

实现效果

完整项目代码后台私信小编01获取!

总结

以上是生活随笔为你收集整理的Python爬取网站用户手机号_设计师的福利,python爬取素材网站的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。