欢迎访问 生活随笔!

生活随笔

当前位置: 首页 >

北京交通大学研究生教务处爬虫

发布时间:2025/3/20 48 豆豆
生活随笔 收集整理的这篇文章主要介绍了 北京交通大学研究生教务处爬虫 小编觉得挺不错的,现在分享给大家,帮大家做个参考.
1 import urllib 2 import urllib2 3 import requests 4 import re 5 6 student = 八位学号 7 password = 密码 8 postdata = urllib.urlencode({ 9 'u':student, 10 'p':password 11 }) 12 13 user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)' 14 headers = {'User-Agent' : user_agent } 15 16 REQUEST = requests.session() 17 REQUEST.post( 18 url = 'http://gsdb.bjtu.edu.cn/client/login/', 19 data = postdata) 20 21 ##get the scores 22 returnPage = REQUEST.get('http://gsdb.bjtu.edu.cn/score/history/') 23 24 ##把成绩抓出来 25 reScore = re.compile(r'<tr>.*?</tr>', re.S) 26 resultList = reScore.findall(returnPage.text) 27 28 Points = [] 29 Scores = [] 30 total = 0 31 for res in resultList: 32 td = re.compile(r'<td>.*?</td>', re.S) 33 tdList = td.findall(res) 34 if (tdList[6]=='<td>学位课</td>'.decode('utf-8')): 35 num = re.compile(r'\d+') 36 point = num.findall(tdList[8]) 37 score = num.findall(tdList[10]) 38 Points.append((int)(point[0])) 39 Scores.append((int)(score[0])) 40 total += (int)(point[0]) * (int)(score[0]) 41 42 if sum(Points)!=0: 43 print str(student) + ' score is: ' + str(total / sum(Points)) 44 else: 45 print 'Can\'t get scores'

 

转载于:https://www.cnblogs.com/asukayui/p/4418208.html

总结

以上是生活随笔为你收集整理的北京交通大学研究生教务处爬虫的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。