欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程语言 > python >内容正文

python

python爬取中国最好大学排名(实例)

发布时间:2024/5/15 python 21 豆豆
生活随笔 收集整理的这篇文章主要介绍了 python爬取中国最好大学排名(实例) 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

要求

爬取2018年最好大学网上排名前20的学校,以表格形式输出,包括(排名,学校名称,总分)


代码

根据基本要求可以编写出初始代码A

#CrawUnivRankingA.py import requests from bs4 import BeautifulSoup import bs4 def getHTMLText(url):try:r=requests.get(url,timeout=30)r.raise_for_status()r.encoding=r.apparent_encodingreturn r.textexcept:return""def fillUnivList(ulist,html):soup=BeautifulSoup(html,"html.parser")for tr in soup.find('tbody').children:if isinstance(tr,bs4.element.Tag):tds=tr('td')ulist.append([tds[0].string,tds[1].string,tds[3].string])def printUnivList(ulist,num):print("{:^10}\t{:^6}\t{:^10}".format("排名","学校名称","总分"))for i in range(num):u=ulist[i]print("{:^10}\t{:^6}\t{:^10}".format(u[0],u[1],u[2]))def main():uinfo=[]url='http://www.zuihaodaxue.cn/zuihaodaxuepaiming2018.html'html=getHTMLText(url)fillUnivList(uinfo,html)printUnivList(uinfo,20) #排名前二十 main()

但是输出效果如下:

学校名称居中对齐并未对齐,是因为自动填充的是英文的空格,要想使得中文获得居中应填充中文的空格,所以进行代码优化,得到代码B:

#CrawUnivRankingA.py import requests from bs4 import BeautifulSoup import bs4 def getHTMLText(url):try:r=requests.get(url,timeout=30)r.raise_for_status()r.encoding=r.apparent_encodingreturn r.textexcept:return""def fillUnivList(ulist,html):soup=BeautifulSoup(html,"html.parser")for tr in soup.find('tbody').children:if isinstance(tr,bs4.element.Tag):tds=tr('td')ulist.append([tds[0].string,tds[1].string,tds[3].string])def printUnivList(ulist,num):tplt="{0:^10}\t{1:{3}^10}\t{2:^10}"print(tplt.format("排名","学校名称","总分",chr(12288)))for i in range(num):u=ulist[i]print(tplt.format(u[0],u[1],u[2],chr(12288)))def main():uinfo=[]url='http://www.zuihaodaxue.cn/zuihaodaxuepaiming2018.html'html=getHTMLText(url)fillUnivList(uinfo,html)printUnivList(uinfo,20) #排名前二十 main()

主要优化部分为:

def printUnivList(ulist,num):tplt="{0:^10}\t{1:{3}^10}\t{2:^10}"print(tplt.format("排名","学校名称","总分",chr(12288)))for i in range(num):u=ulist[i]print(tplt.format(u[0],u[1],u[2],chr(12288)))

利用chr(12288)进行优化,以后很多项目中对中文居中对齐格式优化都会运用它
优化后输出:

总结

以上是生活随笔为你收集整理的python爬取中国最好大学排名(实例)的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。