如果你还在为python的各种urllib和urlibs,cookielib 头疼,或者还还在为python模拟登录和抓取数据而抓狂,那么来看看我们推荐的requests,python采集数据模拟登录必备利器!
这也是python推荐的HTTP客户端库:
本文就以一个模拟登录的例子来加以说明,至于采集大家就请自行发挥吧。
代码很简单,主要是展现python的requests库的简单至极,代码如下:
s = requests.session() data = {'user':'用户名','passdw':'密码'} #post 换成登录的地址, res=s.post('http://www.xxx.net/index.php?action=login',data); #换成抓取的地址 s.get('http://www.xxx.net/archives/155/');
看!仅仅4行代码,即可模拟登录。