当前位置:
首页 >
淘宝爬虫(需要人工扫码一下)
发布时间:2023/12/29
31
豆豆
生活随笔
收集整理的这篇文章主要介绍了
淘宝爬虫(需要人工扫码一下)
小编觉得挺不错的,现在分享给大家,帮大家做个参考.
from selenium import webdriver
import time
import redef gethtml(url):'''定义函数获取html源代码''''''由于淘宝是动态网页无法用requests库获取所以使用selenium模拟器'''driver=webdriver.Chrome()#构造一个Chrom浏览器对象用来控制浏览器driver.get(url)#根据具体的url访问网页# 第一种滑块验证,人工操作i3 = driver.find_element_by_css_selector('#login > div.corner-icon-view.view-type-qrcode > i')i3.click()time.sleep(15) # 等待15秒,用来扫码(人工操作)'''将进度条拉到页面最后'''try:js = 'var q=document.documentElement.scrollTop=10000'driver.execute_script(js) # execute_script()函数运行js下滑脚本except:print('出现错误')html = driver.page_source #获取网页源代码driver.close()#关闭浏览器print('关闭浏览器')#print(html)return htmldef xieru(html):with open("C:\\Users\86666\Desktop\python文件处理\钓鱼.html",'at',encoding
总结
以上是生活随笔为你收集整理的淘宝爬虫(需要人工扫码一下)的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: 装饰模式学习总结
- 下一篇: 天狼50教学中部分英文缩写的含义