欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程语言 > python >内容正文

python

python中提取pdf文件某些页_人工智能|Python提取PDF中的文本并朗读

发布时间:2025/3/15 python 33 豆豆
生活随笔 收集整理的这篇文章主要介绍了 python中提取pdf文件某些页_人工智能|Python提取PDF中的文本并朗读 小编觉得挺不错的,现在分享给大家,帮大家做个参考.
题前的话

之前有老师在群里推荐这个,我看了一眼觉得还是蛮有趣的,然后就忘了……昨天又看到这个《宅男福利!我50行Python代码让小姐姐给你读Pdf》,今天于是开始自己尝试,谁知道pdfplumber库怎么也安装不了,最后才明白原来是高版本不兼容库文件,于是去python官网重新下了个3.7版本的,顺利安装pdfplumber库成功。

海龟编辑器找不到这个库文件,所以用的pip命令安装,用python3.7编辑器运行。

pip install pdfplumber

参考程序:

import pdfplumber
pdf_path = "冉云飞.pdf"
pdf = pdfplumber.open(pdf_path)
text=''for page in range(0,len(pdf.pages)):
text+=pdf.pages[page].extract_text()print(text)

运行后的效果:

接下来设置语言朗读,先安装库:

pip install pyttsx3

pip install pywin32 

#若未安装pywin32, 需要安装此库的

然后加入朗读代码:

import pdfplumber #读取PDF文字

pdf_path = "冉云飞.pdf"

pdf = pdfplumber.open(pdf_path)
text=''for page in range(0,len(pdf.pages)):
text+=pdf.pages[page].extract_text()print(text)

import pyttsx3 #朗读代码

engine = pyttsx3.init()

engine.say(text)
engine.runAndWait()

运行后即可测试效果,代码简单,效果不错。

如果是文本文件,代码就更加简单了:

import pyttsx3
engine = pyttsx3.init()
engine.say(open("冉云飞.txt","r").read())
engine.runAndWait()

文本文件的内容:

相关文章:

Python相关的各类竞赛及考级人工智能系列:人工智能|第六章baidu-aip应用体验程序(四个)人工智能|Python调用百度人脸对比检测体验人工智能|Python一次进行多张照片的人脸比对

总结

以上是生活随笔为你收集整理的python中提取pdf文件某些页_人工智能|Python提取PDF中的文本并朗读的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。