最近在学习python爬虫,看到网上有很多关于模拟豆瓣登录的例子,随意找了一个试了下,发现不能运行,对比了一下代码和豆瓣网站,发现原来是豆瓣网站做了修改,增加了反爬措施。

首先看下要模拟登录的网站:

打开开发者模式:

在账号和密码随意填入数据:

发现会发送一个post请求:

ur是:https://accounts.douban.com/j/mobile/login/basic
数据格式是:

于是可以来编写代码:
import requests
def main():
url_basic = 'https://accounts.douban.com/j/mobile/login/basic'
url = 'https://www.douban.com/'
ua_headers = { "User-Agent":'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.0; Trident/4.0)'}
data = {
'ck': '',
'name': '自己的账号',
'password': '自己的密码',
'remember': 'false',
'ticket': ''
}
s = requests.session()
s.post(url=url_basic, headers=ua_headers, data=data)
response = s.get(url=url, headers=ua_headers)
with open('douban.html' , 'wb') as f:
f.write(response.content)
if __name__ == '__main__':
main()另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。
Copyright © 2009-2022 www.fjjierui.cn 青羊区广皓图文设计工作室(个体工商户)达州站 版权所有 蜀ICP备19037934号