欢迎访问 生活随笔!

生活随笔

当前位置: 首页 >

正则匹配问号_爬虫之正则表达式

发布时间:2023/12/15 43 豆豆
生活随笔 收集整理的这篇文章主要介绍了 正则匹配问号_爬虫之正则表达式 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

1什么是正则表达式
正则表达式,也称规则表达式(Regular Expression,在代码中常简写为RE)。
2为什么使用
用来匹配、替换一类具有相同规则字符串
3使用规则
3.1单字符:

3.2数量修饰:

3.3边界:

3.4分组:


3.5贪婪模式与非贪婪模式
贪婪模式:.* (匹配>=0次) .+ (匹配>=1次)

非贪婪模式:.*? .+?(加问号就是非贪婪)

3.6 匹配

3.6.1 re.I-忽略大小写

3.6.2 re.M-匹配多行

3.6.3 re.S-单行匹配


3.7 正则表达式函数

3.7.1 re.match()

3.7.2 re.search()

3.7.3 re.findall()

3.7.4 re.sub()


4 案例演示(爬取糗事百科图片)
4.1 爬虫思路:
① 确定网址
② 确定初始结束页
③ 发送请求获取内容
④ 获取图片列表
⑤ 写入文件并且下载单个图片

4.2 案例代码

总结

以上是生活随笔为你收集整理的正则匹配问号_爬虫之正则表达式的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。