当前位置：首页 > 编程语言 > python >内容正文

python

python中提取pdf文件某些页_人工智能|Python提取PDF中的文本并朗读

发布时间：2025/3/15 python 33 豆豆

生活随笔收集整理的这篇文章主要介绍了 python中提取pdf文件某些页_人工智能|Python提取PDF中的文本并朗读小编觉得挺不错的,现在分享给大家,帮大家做个参考.

题前的话

之前有老师在群里推荐这个，我看了一眼觉得还是蛮有趣的，然后就忘了……昨天又看到这个《宅男福利！我50行Python代码让小姐姐给你读Pdf》，今天于是开始自己尝试，谁知道pdfplumber库怎么也安装不了，最后才明白原来是高版本不兼容库文件，于是去python官网重新下了个3.7版本的，顺利安装pdfplumber库成功。

海龟编辑器找不到这个库文件，所以用的pip命令安装，用python3.7编辑器运行。

pip install pdfplumber

参考程序：

import pdfplumber
pdf_path = "冉云飞.pdf"
pdf = pdfplumber.open(pdf_path)
text=''for page in range(0,len(pdf.pages)):
text+=pdf.pages[page].extract_text()print(text)

运行后的效果：

接下来设置语言朗读，先安装库：

pip install pyttsx3

pip install pywin32

#若未安装pywin32, 需要安装此库的

然后加入朗读代码：

import pdfplumber #读取PDF文字

pdf_path = "冉云飞.pdf"

pdf = pdfplumber.open(pdf_path)
text=''for page in range(0,len(pdf.pages)):
text+=pdf.pages[page].extract_text()print(text)

import pyttsx3 #朗读代码

engine = pyttsx3.init()

engine.say(text)
engine.runAndWait()

运行后即可测试效果，代码简单，效果不错。

如果是文本文件，代码就更加简单了：

import pyttsx3
engine = pyttsx3.init()
engine.say(open("冉云飞.txt","r").read())
engine.runAndWait()

文本文件的内容：

Python相关的各类竞赛及考级人工智能系列：人工智能|第六章baidu-aip应用体验程序(四个)人工智能|Python调用百度人脸对比检测体验人工智能|Python一次进行多张照片的人脸比对

总结

以上是生活随笔为你收集整理的python中提取pdf文件某些页_人工智能|Python提取PDF中的文本并朗读的全部内容，希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错，欢迎将生活随笔推荐给好友。

上一篇：实现光晕效果_马自达6车灯升级激光四透镜
下一篇： python读取文件数据堆栈溢出的原因_