没想到毕业之后还会折腾这破玩意。大学时用RGSS语言完成过一个类似的功能(虽然最近才知道它和Ruby语言有关),但没用Python写过。其实代码完全没难度,但这套系统很讨厌,它用.NET语言写成,出现最多的是页面是“当前访问人数过多,请稍后访问”,系统开发者最擅长的是制作登录界面,一口气做了5个(这得多闲啊……)。其中的default3.aspx不需要验证码。登录时必须带一个叫__VIEWSTATE参数,推测是系统自动生成,每隔一段时间会更换。
所以与其说我是分享Python代码,不如说我是分享正方系统的彩蛋来得准确。但好歹功能代码是Python的,总之都是非常基础的功能,包括:
- urllib和urllib2的使用
- 登录之后保存cookie
- 用BeautifulSoup(新版是bs4)分析页面内容
以上,直接贴代码:
import random import urllib import urllib2 import cookielib from BeautifulSoup import BeautifulSoup _xh = '学号' _pw = '密码' login_url = 'http://网址/default3.aspx' #课表的网址 timetable_url = 'http://网址/xskbcx.aspx?xh=%s'% _xh student_cookie = cookielib.CookieJar() opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(student_cookie)) # Login data = '__VIEWSTATE='+VIEWSTATE+'&TextBox1='+_xh+'&TextBox2='+_pw+'&ddl_js=%D1%A7%C9%FA&Button1=+%B5%C7+%C2%BC+' login_request = urllib2.Request(login_url, data, { 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8', 'Accept-Charset': 'UTF-8,*;q=0.5', 'User-Agent': USER_AGENT, 'Content-Type': 'application/x-www-form-urlencoded', 'Connection': 'keep-alive', 'HOST': '网址', 'Origin': 'http://网址', 'Referer': 'http://网址/default3.aspx'}) opener.open(login_request, data) html = opener.open(timetable_url).read()
获得html之后用BeautifulSoup解析,先找到table标签,然后通过id获取DOM:
soup = BeautifulSoup(html, fromEncoding='gbk') table = soup.find("table", {"id": "Table1"})
搞定了,欢迎各位以此为基础制作各种选课程序。= =v
转载请注明:爱开源 » 用Python登录正方系统获取课表