欢迎访问 生活随笔!

生活随笔

当前位置: 首页 >

十二、爬了CSDN,我发现了这些

发布时间:2024/10/8 57 豆豆
生活随笔 收集整理的这篇文章主要介绍了 十二、爬了CSDN,我发现了这些 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

最近,有点兴趣爬下自己在CSDN 的博客,并做出词云图来看下自己究竟写了什么

说起,就开干,下面是博客主页:https://blog.csdn.net/weixin_44510615

环境

  • 操作系统:Windows

  • Python版本:3.7.2

模块

本文涉及到的Python第三方模块,共计五个:分词模块jieba,文字云模块wordcloud,画图模块matplotlib,用来处理背景图片的模块cv2,访问的模块requests,解析的模块bs4
这些模块均可通过pip方式进行安装。

实现思路

先获得每个文章的前言,用集合来存储,这样可以达到去重,在拼接成字符串。再通过jieba模块对字符串进行分词处理,然后对处理后的材料使用wordcloud文字云模块生成相应的词云图片即可。

先判断是否访问成功

titles = set() def html(url):if url:r = request

总结

以上是生活随笔为你收集整理的十二、爬了CSDN,我发现了这些的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。