使用Python实现网站登录功能
使用已有cookie登陆
使用浏览器登陆,获取浏览器中的cookie信息,来进行登陆。
我们以博客园为例,先登录博客园账号。我们访问随笔列表,在控制台我们可以看到我们登陆后浏览器的cookie
剔除一些数据统计及分析的cookie,剩下的就是登陆可能需要的.CNBlogsCookie
和.Cnblogs.AspNetCore.Cookies
# _ga google分析 cookie
# UM_distinctid 友盟cookie
# CNZZxxx CNZZcookie
# __utma,__utmc,__utmz google统计网站
# Hm_lvt_xxx 百度统计网站
import urllib.request
url = 'https://i.cnblogs.com/posts'
user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36'
#浏览器登录后得到的cookie,也就是刚才复制的字符串
cookie_str = '.CNBlogsCookie=xxx; .Cnblogs.AspNetCore.Cookies=xxx'
headers = {
'User-Agent': user_agent,
'cookie':cookie_str
}
req = urllib.request.Request(url,headers=headers)
resp = urllib.request.urlopen(req).read().decode('utf-8')
print(resp)
登陆获取cookie
登陆的表单一般是使用的form data
,现在也有些表单使用request payload
使用json格式传参。
-
form data
如药智网
-
request payload
如博客园
form data
博客园的登陆需要拖动验证所以略过。我们以药智网为例,我们打开控制台可以看到登陆需要传的表单参数,这里是使用的form data
表单。我们模拟登陆后获取到登陆后的cookie,然后访问登录后的个人中心页面。
import urllib.request
import http.cookiejar
url = 'https://www.yaozh.com/login'
user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36'
# formData数据
data = {'username': '用户名',
'pwd': '密码',
'formhash': 'C3086BBA84',
'backurl': 'https%3A%2F%2Fwww.yaozh.com%2F'}
post_data = urllib.parse.urlencode(data).encode('utf-8')
# 请求头设置
headers = {
'User-Agent': user_agent
}
# 构造登陆请求
req = urllib.request.Request(url, headers=headers, data=post_data)
# cookie
cookie = http.cookiejar.CookieJar()
# 构造一个opener携带登录后的cookie
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cookie))
# 发送登陆请求
resp = opener.open(req)
print(resp)
# 登录后个人中心
url = 'https://www.yaozh.com/member/'
# 构造访问请求
req = urllib.request.Request(url, headers=headers)
resp = opener.open(req).read().decode('utf-8')
print(resp)
request payload
如果登陆需要request payload
我们需要将参数转为json字符串并在头部设置Content-Type
import json
...
data = {'loginType': '1',
'pwdOrVerifyCode': '密码',
'userIdentification': '账号',
'uaToken': '',
'webUmidToken':''}
headers = {
'Content-Type': 'application/json;charset=UTF-8',
'User-Agent': user_agent
}
req = urllib.request.Request(url, headers=headers, data=json.dumps(data))
...
登陆后用session保持登陆状态
我们用requests
模块的Session对象来保存回话信息
import requests
url = 'https://www.yaozh.com/login'
user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36'
# formData数据
data = {'username': 'chenjy1225',
'pwd': '19931225yjy',
'formhash': 'C3086BBA84',
'backurl': 'https%3A%2F%2Fwww.yaozh.com%2F'}
#构造Session
session = requests.Session()
# 发送post请求
resp = session.post(url, data)
# 登录后个人中心
url = 'https://www.yaozh.com/member/'
# 发送请求访问个人中心
resp = session.get(url).content.decode('utf-8')
print(resp)
调用浏览器登陆
我们也可以在程序中调用一个浏览器来访问登陆网站。在python中使用Selenium库就能轻松实现调用浏览器,被控制的浏览器可以是chrome、firefox等。
以前较常用的还是PhantomJS但是PhantomJS被python弃用了。
UserWarning: Selenium support for PhantomJS has been deprecated, please use headless versions of Chrome or Firefox instead
warnings.warn('Selenium support for PhantomJS has been deprecated, please use headless '
firefox对应的geckodriver
chrome对应的chromedriver
1.下载Selenium、firefox浏览器及firefox驱动。
2.将下载的firefox驱动geckodriver放在firefox浏览器安装目录
3.将firefox浏览器安装目录添加到path中
4.重启ide
我们找到需要登陆时候输入的元素id及登陆button id。
from selenium import webdriver
import time
# 新建selenium浏览器对象,后面是geckodriver.exe下载后本地路径
browser = webdriver.Firefox()
url = 'https://www.yaozh.com/login'
# 浏览器访问登录页面
browser.get(url)
# 等待3s用于加载脚本文件
browser.implicitly_wait(3)
# 输入用户名
username = browser.find_element_by_id('username')
username.send_keys('chenjy1225')
# 输入密码
password = browser.find_element_by_id('pwd')
password.send_keys('19931225yjy')
# 点击登录按钮
login_button = browser.find_element_by_id('button')
login_button.submit()
# 网页截图
browser.save_screenshot('screenshot.png')
# 强制等待5s,等待登录后的跳转
time.sleep(5)
url = 'https://www.yaozh.com/member/'
browser.get(url)
# 网页截图个人中心
browser.save_screenshot('screenshot1.png')
# 关闭浏览器
browser.quit()
screenshot.png:
screenshot1.png:
推荐阅读
-
开源项目 "功能强大且易于使用的开源网站构建工具 - halo
-
2019升级最新Python学习路线:关于电影票务网站实现的讲解
-
35 岁实现财务*,腾讯程序员手握2300万提前退休?-1000万房产、1000万腾讯股票、加上300万的现金,一共2300万的财产。有网友算了一笔账,假设1000万的房产用于自住,剩下1300万资产按照平均税后20-50万不等进行计算,大约花上26-60年左右的时间才能赚到这笔钱。也就是说,普通人可能奋斗一辈子,才能赚到这笔钱。在很多人还在为中年危机而惶惶不可终日的时候,有的人的35岁,就已经安全着陆,试问哪个打工人不羡慕?但问题是有这样财富积累必然有像样的实力做靠山。没有人可以不劳而获。 看到这里,肯定有人说,那么对于普通人来说,卷可能真就成了唯一的出路。但是卷也有轻松的卷,“偷懒”的卷法,对于程序员而言,刨除掉一时无法改掉的开会传统占用的大部分时间,如何把有限的时间和精力放在真正重要的架构设计、需求设计上,而不是重复的造*,编码、改bug、手动测试。因此在科技改变生活的今天,学会使用AI工具成为程序员们的必备技能。 以全栈式全自动的软件开发工具飞算SoFlu软件机器人为例,作为全球首款面向微服务架构设计和最佳实践的软件机器人,SoFlu软件机器人改变了原来手工编码的作业模式,通过可视化拖拽方式以及参数配置就能实现等同于编写复杂代码的业务逻辑,在设计业务逻辑时就完成了微服务应用开发,做到“业务即图,图即代码”,实现“软件开发,十倍提效”。 而作为飞算SoFlu软件机器人的一个重要组成部分,FuncGPT(慧函数)支持所有类型函数创建。通过自然语言描述Java函数需求,实时生成高质量、高可读性的Java函数代码。生成代码可直接复制到IDEA,或一键导入Java全自动开发工具函数库。 FuncGPT(慧函数)具有五大核心能力: ● 自然语言:通过自然语言即可生成函数,降低软件开发门槛。 ● 秒级函数开发:全自动秒级开发函数,秒级完成,效率千倍提升。 ● 一站式函数开发应用:函数生成即可直接应用,效率、安全有保障。 ● 质量可靠:生成的函数代码符合业界规范、具备良好的可读性,符合最优解。 ● 灵活生成:可以根据开发人员的具体需求生成并支持调整和修改。 以“将文件流转换为File对象”这个需求为例,以下是FuncGPT(慧函数)秒级生成的代码: / 类名:FileConverter // 函数名:convertStreamToFile // 函数功能:将文件流转换为File对象 // POM依赖包:无 import java.io.File; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; public class FileConverter { /** * 将文件流转换为File对象 * @param inputStream 文件流 * @param filePath 文件路径 * @param fileName 文件名 * @return 转换后的File对象 * @throws IOException 如果发生I/O异常 */ public static File convertStreamToFile(InputStream inputStream, String filePath, String fileName) throws IOException { File file = new File(filePath + File.separator + fileName); // 创建File对象 try (FileOutputStream outputStream = new FileOutputStream(file)) { // 创建文件输出流 byte buffer = new byte[1024]; int bytesRead; while ((bytesRead = inputStream.read(buffer)) != -1) { // 从文件流读取数据并写入文件 outputStream.write(buffer, 0, bytesRead); } } return file; // 返回转换后的File对象 } } // 函数示例 // 将文件流转换为File对象示例 // 入参:inputStream,文件流 // 入参:filePath,文件路径 // 入参:fileName,文件名 // 出参:file,转换后的File对象 // 调用示例: // InputStream inputStream = new FileInputStream("example.txt"); // String filePath = "C:\\Users\\User\\Documents"; // String fileName = "example.txt"; // File file = FileConverter.convertStreamToFile(inputStream, filePath, fileName); // System.out.println(file.getAbsolutePath); // 输出结果:例如,将文件流转换为File对象后,文件的绝对路径为:C:\Users\User\Documents\example.txt // 则输出结果为:C:\Users\User\Documents\example.txt 通过分析,不难发现以上代码:
-
如何使用 PowerBI 实现分时比较功能?
-
贪婪算法在 Python、JavaScript、Java、C++ 和 C# 中的多种实现及其在硬币变化、分数骑士、活动选择和使用哈夫曼编码的最小生成树问题中的应用实例
-
通过 Python 脚本操作 Excel 实现批量替换功能
-
python - django(实现电子邮件账户注册和验证码功能)
-
PHP邮箱认证登录注册功能的实现方法和步骤介绍
-
在 Django 中使用 python 的 django-mptt 库来实现无限级树结构非常直观且易于实现
-
使用 springboot 整合 mybatis-plus 实现视点功能