欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程语言 > python >内容正文

python

Python + Selenium 练习篇 - 获取页面所有邮箱

发布时间:2025/7/14 python 60 豆豆
生活随笔 收集整理的这篇文章主要介绍了 Python + Selenium 练习篇 - 获取页面所有邮箱 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

代码如下:

# coding=utf-8
import re    #python中利用正则,需要导入re模块
from selenium import webdriver
driver = webdriver.Chrome()
driver.maximize_window()
url = ("http://home.baidu.com/contact.html")
driver.get(url)
doc = driver.page_source   #获得页面源代码
emails = re.findall(r'[\w]+@[\w\.-]+',doc) #正则表达式,找出xxx@xxx.xxx的字段并保存
for email in emails:    #循环打印匹配的邮箱
    print (email) 

注意:在python正则表达式语法中,python中字符串前面加上r表示原生字符串,用\w表示匹配字母数字及下划线。re模块下findall方法返回的是一个匹配子字符串的列表

转载于:https://www.cnblogs.com/AmyHu/p/8821255.html

总结

以上是生活随笔为你收集整理的Python + Selenium 练习篇 - 获取页面所有邮箱的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。