当前位置:
首页 >
正则匹配问号_爬虫之正则表达式
发布时间:2023/12/15
43
豆豆
生活随笔
收集整理的这篇文章主要介绍了
正则匹配问号_爬虫之正则表达式
小编觉得挺不错的,现在分享给大家,帮大家做个参考.
1什么是正则表达式
正则表达式,也称规则表达式(Regular Expression,在代码中常简写为RE)。
2为什么使用
用来匹配、替换一类具有相同规则字符串
3使用规则
3.1单字符:
3.2数量修饰:
3.3边界:
3.4分组:
3.5贪婪模式与非贪婪模式
贪婪模式:.* (匹配>=0次) .+ (匹配>=1次)
非贪婪模式:.*? .+?(加问号就是非贪婪)
3.6 匹配
3.6.1 re.I-忽略大小写
3.6.2 re.M-匹配多行
3.6.3 re.S-单行匹配
3.7 正则表达式函数
3.7.1 re.match()
3.7.2 re.search()
3.7.3 re.findall()
3.7.4 re.sub()
4 案例演示(爬取糗事百科图片)
4.1 爬虫思路:
① 确定网址
② 确定初始结束页
③ 发送请求获取内容
④ 获取图片列表
⑤ 写入文件并且下载单个图片
4.2 案例代码
总结
以上是生活随笔为你收集整理的正则匹配问号_爬虫之正则表达式的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: 1月19日起!英雄联盟全场半价来袭 玩家
- 下一篇: 未备案域名临时跳过备案提示_做好了网页,