Python抓取教务处信息
练习使用类、多线程、urlib库的时候写的一个东西,作用是从教务处抓取年级信息、班级信息、学生信息、学生成绩信息等。当时写得有些乱,纯三无产品,不过基本能用,且网络好的情况下效率不低,多线程抓取,出错自动重试,需要的TX可以参考或者直接用来抓取数据。
用到的库有urllib2,cookielib,os,sys,urllib,re,MySQLdb,threading,time,Queue,其中MySQLdb为第三方库,需自己安装,数据库结构文件为python.sql。