当前位置:
首页 >
python获取get请求的耗时时间_突破python爬取极限,超牛逼的异步协程爬虫
发布时间:2024/10/14
57
豆豆
生活随笔
收集整理的这篇文章主要介绍了
python获取get请求的耗时时间_突破python爬取极限,超牛逼的异步协程爬虫
小编觉得挺不错的,现在分享给大家,帮大家做个参考.
异步协程
1. event_loop
2. coroutine
中文翻译叫协程,在 Python 中昌指代为协程对象类型,可以将协程对象注册到时间循环中被调用。使用 async 关键字来定义的方法在调用时不会立即执行,而是返回一个协程对象。
总耗时大概是2.65秒,你是不是觉得这就很快了?其实还有更快的代码:
大约0.98秒就可以爬完所有的网页。
这是因为第一种方法并不是真正的异步请求,在异步协程中如果出现同步模块相关的代码则无法实现异步,比如requests.get()属于同步模块的代码。
要想实现真正的异步协程爬虫必须使用基于异步的网络请求模块,所以要使用 aiohttp 模块,这个模块需要安装:
它的使用与 requests 模块类似,需要注意的是,aiohttp 获取响应数据操作之前一定要使用 await 进行挂起。
在执行协程的时候,如果遇到了 await,那么就会将当前协程挂起,转而执行其它的协程,直到其它协程也挂起或执行完毕,再进行下一个协程的执行。
想学python的小伙伴可以vx关注我:芝麻代理
学习视频免费分享
回复资料分享即可领取
总结
以上是生活随笔为你收集整理的python获取get请求的耗时时间_突破python爬取极限,超牛逼的异步协程爬虫的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: 风控策略和模型的区别_风控模型之产品赢利
- 下一篇: python宇晨_Python 学习第1