网易云课堂解析_使用SQL分析网易云课堂职场提升类课程
前言:
正值毕业季,职场相关话题毋庸置疑又再次成为热门话题,结束学校生活并不意味着学习的终结,真正走入职场才会发现学习才刚刚开始。许多职场人士为了在激烈的市场竞争中保持竞争力,都会选择在工作之余学习充电。那么什么样的课程最受职场人士青睐或者说什么样的课程最有市场?俗话说:知己知彼百战百胜,弄清楚职场人士都在学些什么,对于自己跟上职场步伐,以及自我审视与时俱进都有积极意义。为了大致了解以上问题,本文选择国内知名互联网教育平台——网易云课堂“职场提升”模块的全部课程进行浅析。
分析思路:
分析思路正文
一、提出问题
1、职场提升模块课程的用户规模如何?
2、最受用户欢迎的热门课程是什么?
3、职场提升模块下各分类课程学习人数分布及占比情况如何?
4、最热门课程分类下子分类(主题)课程的分布情况及占比如何?
5、哪个课程的客单价最高?哪个课程的用户付费总额最高?热门课程单价如何?
二、理解数据
本文的数据来源:
爬取网易云课程官网课程(职场提升模块)数据集,共计1331条数据(获取时间:2019.6.23日),因课程官网数据存在变动,该数据仅供参考。
求职准备study.163.com爬取职场提升模块下所有课程数据获取的原数据如下:
源数据清洗后数据集字段特征(具体清洗步骤在本文第三部分):
1、category :课程分类
2、c_link : 课程分类链接
3、title:课程子分类
4、t_link:子分类课程链接
5、coursename:课程名
6、cn:课程编号
7、score :课程评分
8、price:客单价
9、num_students:学习人数
10、id:编号(主键)
三、数据清洗
1、导入数据,修改数据类型,字段重命名
字段“score”“price”“mum_students”类型应修改为“int”,但由于数据尚未清洗,字段中存在有价值文本信息,故类型修改放到下面的环节处理,在此仅对字段重命名,把中文字段用英文重命名。英文命名在后期的SQL查询中不容易报错,这里涉及字符集编码问题,本文不作具体说明。
数据导入成功,并具体查看前10条数据情况:
数据导入成功查询前十条数据2、一致化处理
1)提取课程编号(cn)
- 通过观察字段“link2”找到课程的编号
- 更改字段名称为“cn”(课程编号)
- 提取课程编号
以上课程编号已提取成功,我们来看下效果:
课程编号提取成功2)提取学过的人数
处理方法同上
提取学过的人数看下结果:
提取人数成功3、删除重复项
1)查找重复值
这里使用课程编号字段,查找重复值
查找重复值2)删除重复值
查找出重复值后需要删除重复项,但需要保留唯一的记录,这里通过增加主键,在此基础上增加筛选条件达到保留唯一记录的结果。
增加主键“id”增加主键成功删除重复项并保留唯一记录检验一下结果,处理成功,无重复值:
无重复值4、缺失值处理
1)查找空值
查找空值由返回结果可知,无空值,故无需处理。
四、构建模型
1、职场提升模块课程的用户规模如何?
由查询结果可知,职场提升类课程累计学习人数5419256,反映了该类课程学习人数较多,用户规模较大。
2、最受用户欢迎的热门课程是什么?
查询上课人数量前十名,按照降序排列得出热门课程
热门课程前十名热门课程排名第一名的是《跟王佩丰学Excel视频教程》,累计学习人数468000,相当大的用户体量,从侧面反应Excel课程很受职场人士的追捧。
3、职场提升模块下各分类课程学习人数分布及占比情况如何?
各主题课程学习人数分布各主题课程学习人数占比由上可知,办公软件类课程排名第一,累计学习人数达到350多万,占比65%。当之无愧的成为职场提升模块下最热门课程分类。
4、最热门课程分类下子分类(主题)课程的分布情况及占比如何?
子分类课程的分布情况及占比“办公软件”作为最热门的课程分类,其子分类排名前三甲分别是Excel、PPT、Word;从侧面体现了office办公软件在职场中具有十分重要的地位,可以说是必备的职场技能。其中,Excel学习人数占比50%,占了整个办公软件分类所有课程的一半,说明Excel技能在职场中处于核心必备技能。
5、哪个课程的客单价最高?哪个课程的用户付费总额最高?热门课程单价如何?
课单价最高的课程课单价最高的课程是《corona渲染器写实教程》,该课程属于专业类课程,有其特定的职业属性,不具备代表性,在此不做进一步分析。
总收入排名前10的课程在总收入排名前十的课程中office办公软件类课程占了6位,课程单价范围在169~499元之间,价值亲民,性价比较高。同时在营收方面也很可观,其中《和秋叶一起学PPT》课程总收入过千万,而其他几门课程总收入也均在450万以上,营收也可以从侧面反映此类课程的市场认可度较好,从一定程度上说明office办公技能在职场中无可撼动的霸主地位。
注:数据中课程价格均为原价,不涉及促销折扣价格。因在上述课程单价中出现破千元单价,影响整体判断属于异常值,故《520节=Excel+PPT+word小白变高手》课程使用官网折扣价格499元。
五、结论
1、网易云课堂—职场提升类课程累计学习人数5419256,用户规模较大,课程的市场关注度高。
2、热门课程排名第一名的是《跟王佩丰学Excel视频教程》,累计学习人数468000,单门课程有如此多的人学习可以说是非常成功,从侧面反应Excel课程很受职场人士的追捧。
3、办公软件类课程排名第一,累计学习人数达到350多万,占比65%,占据职场提升类课程半壁江山,当之无愧的成为职场提升模块下最热门课程分类。
4、“办公软件”作为最热门的课程分类,其子分类排名前三甲分别是Excel、PPT、Word;体现了office办公软件在职场中具有十分重要的地位,可以说是必备的职场技能。其中,Excel学习人数占比50%,占了整个办公软件分类所有课程的一半,说明Excel技能在职场中处于核心必备技能。
5、在总收入排名前十的课程中office办公软件类课程占了6位,同时课程主打亲民路线,定价在169~499元之间,性价比较高。正是由于该类课程性价比高所以在营收方面表现的也十分可观,其中《和秋叶一起学PPT》课程总收入过千万,而其他几门课程总收入也均在450万以上,营收情况也可以从侧面反映此类课程的市场认可度较好,从一定程度上说明office办公技能在职场中无可撼动的霸主地位。
总结
以上是生活随笔为你收集整理的网易云课堂解析_使用SQL分析网易云课堂职场提升类课程的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: linux两台服务器传输,Linux两台
- 下一篇: redis stream java消息队