当前位置:
首页 >
十二、爬了CSDN,我发现了这些
发布时间:2024/10/8
57
豆豆
生活随笔
收集整理的这篇文章主要介绍了
十二、爬了CSDN,我发现了这些
小编觉得挺不错的,现在分享给大家,帮大家做个参考.
最近,有点兴趣爬下自己在CSDN 的博客,并做出词云图来看下自己究竟写了什么
说起,就开干,下面是博客主页:https://blog.csdn.net/weixin_44510615
环境
-
操作系统:Windows
-
Python版本:3.7.2
模块
本文涉及到的Python第三方模块,共计五个:分词模块jieba,文字云模块wordcloud,画图模块matplotlib,用来处理背景图片的模块cv2,访问的模块requests,解析的模块bs4
这些模块均可通过pip方式进行安装。
实现思路
先获得每个文章的前言,用集合来存储,这样可以达到去重,在拼接成字符串。再通过jieba模块对字符串进行分词处理,然后对处理后的材料使用wordcloud文字云模块生成相应的词云图片即可。
先判断是否访问成功
titles = set() def html(url):if url:r = request总结
以上是生活随笔为你收集整理的十二、爬了CSDN,我发现了这些的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: 芒果吃多了好吗为什么?
- 下一篇: 一个简单的线性拟合问题,到底有多少种做法