python中提取pdf文件某些页_人工智能|Python提取PDF中的文本并朗读
生活随笔
收集整理的这篇文章主要介绍了
python中提取pdf文件某些页_人工智能|Python提取PDF中的文本并朗读
小编觉得挺不错的,现在分享给大家,帮大家做个参考.
题前的话
pdf_path = "冉云飞.pdf"
pdf = pdfplumber.open(pdf_path)
text=''for page in range(0,len(pdf.pages)):
text+=pdf.pages[page].extract_text()print(text)
text=''for page in range(0,len(pdf.pages)):
text+=pdf.pages[page].extract_text()print(text)
engine.runAndWait()
engine = pyttsx3.init()
engine.say(open("冉云飞.txt","r").read())
engine.runAndWait()
之前有老师在群里推荐这个,我看了一眼觉得还是蛮有趣的,然后就忘了……昨天又看到这个《宅男福利!我50行Python代码让小姐姐给你读Pdf》,今天于是开始自己尝试,谁知道pdfplumber库怎么也安装不了,最后才明白原来是高版本不兼容库文件,于是去python官网重新下了个3.7版本的,顺利安装pdfplumber库成功。
海龟编辑器找不到这个库文件,所以用的pip命令安装,用python3.7编辑器运行。
pip install pdfplumber
参考程序:
import pdfplumberpdf_path = "冉云飞.pdf"
pdf = pdfplumber.open(pdf_path)
text=''for page in range(0,len(pdf.pages)):
text+=pdf.pages[page].extract_text()print(text)
运行后的效果:
接下来设置语言朗读,先安装库:
pip install pyttsx3
pip install pywin32
#若未安装pywin32, 需要安装此库的
然后加入朗读代码:
import pdfplumber #读取PDF文字
pdf_path = "冉云飞.pdf"
pdf = pdfplumber.open(pdf_path)text=''for page in range(0,len(pdf.pages)):
text+=pdf.pages[page].extract_text()print(text)
import pyttsx3 #朗读代码
engine = pyttsx3.init()
engine.say(text)engine.runAndWait()
运行后即可测试效果,代码简单,效果不错。
如果是文本文件,代码就更加简单了:
import pyttsx3engine = pyttsx3.init()
engine.say(open("冉云飞.txt","r").read())
engine.runAndWait()
文本文件的内容:
相关文章:
Python相关的各类竞赛及考级人工智能系列:人工智能|第六章baidu-aip应用体验程序(四个)人工智能|Python调用百度人脸对比检测体验人工智能|Python一次进行多张照片的人脸比对总结
以上是生活随笔为你收集整理的python中提取pdf文件某些页_人工智能|Python提取PDF中的文本并朗读的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: 实现光晕效果_马自达6车灯升级激光四透镜
- 下一篇: python读取文件数据堆栈溢出的原因_