python爬取中国最好大学排名(实例)
生活随笔
收集整理的这篇文章主要介绍了
python爬取中国最好大学排名(实例)
小编觉得挺不错的,现在分享给大家,帮大家做个参考.
要求
爬取2018年最好大学网上排名前20的学校,以表格形式输出,包括(排名,学校名称,总分)
代码
根据基本要求可以编写出初始代码A
#CrawUnivRankingA.py import requests from bs4 import BeautifulSoup import bs4 def getHTMLText(url):try:r=requests.get(url,timeout=30)r.raise_for_status()r.encoding=r.apparent_encodingreturn r.textexcept:return""def fillUnivList(ulist,html):soup=BeautifulSoup(html,"html.parser")for tr in soup.find('tbody').children:if isinstance(tr,bs4.element.Tag):tds=tr('td')ulist.append([tds[0].string,tds[1].string,tds[3].string])def printUnivList(ulist,num):print("{:^10}\t{:^6}\t{:^10}".format("排名","学校名称","总分"))for i in range(num):u=ulist[i]print("{:^10}\t{:^6}\t{:^10}".format(u[0],u[1],u[2]))def main():uinfo=[]url='http://www.zuihaodaxue.cn/zuihaodaxuepaiming2018.html'html=getHTMLText(url)fillUnivList(uinfo,html)printUnivList(uinfo,20) #排名前二十 main()但是输出效果如下:
学校名称居中对齐并未对齐,是因为自动填充的是英文的空格,要想使得中文获得居中应填充中文的空格,所以进行代码优化,得到代码B:
主要优化部分为:
def printUnivList(ulist,num):tplt="{0:^10}\t{1:{3}^10}\t{2:^10}"print(tplt.format("排名","学校名称","总分",chr(12288)))for i in range(num):u=ulist[i]print(tplt.format(u[0],u[1],u[2],chr(12288)))利用chr(12288)进行优化,以后很多项目中对中文居中对齐格式优化都会运用它
优化后输出:
总结
以上是生活随笔为你收集整理的python爬取中国最好大学排名(实例)的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: ZEMAX实例学习5:施密特—卡塞格林系
- 下一篇: MYSQL数据库ANY的用法_列子查询中