探索深度学习的标准参考模型
最编程
2024-02-29 11:12:36
...
深度学习的默认基准模型
1.根据问题的复杂性,项目开始时可能无需使用深度学习
如果只需要正确选择几个线性权重就能解决问题,那么项目开始可以使用一个简单的统计模型,如逻辑回归
2.如果问题属于 “AI-完全”类型的,如对象识别、语音识别等,那么项目开始于一个合适的深度学习模型,则效果会比较好
3.根据数据结构选择一类合适的模型:
如果是以固定大小的向量作为输入的有监督学习,那么可以使用全连接的前馈网络
如果输入已知的拓扑结构(如图像),则可以使用卷积网络
如果输入或者输出是一个序列,则使用门控循环网络(LSTM 或者 GRU)
4.刚开始时可以使用某些分段线性单元:如 ReLU或者其扩展
5.可以选择具有衰减学习率以及动量的SGD作为优化算法
常见的衰减方法有:
衰减到固定最低学习率的线性衰减
指数衰减
每次发生验证错误停滞时将学习率降低 2-10 倍的衰减策略
另一种优化选择是 Adam算法
6.batch normalization对优化性能有着显著的影响,特别是对于卷积网络和具有sigmoid非线性函数的网络而言
最初的基准中,可以忽略batch normalization
当优化似乎出现问题时,应立即使用batch normalization
7.除非训练集包含数千万或者更多的样本,否则项目一开始就应该包含一些温和的正则化
建议采用早停策略
建议采用dropout策略,它也兼容很多模型以及许多正则化项
batch normalization 有时可以降低泛化误差,此时可以省略dropout策略。因为用于 normaliz
推荐阅读
-
YoloDeployCsharp]深度学习模型部署测试平台基于 .NET 的 YOLO 深度学习模型部署测试平台
-
[摘要] 配置运行深度学习模型的主机
-
深度学习的模型转换(.pt 到 .engine)--推理
-
深度学习训练模型中的历时、批量大小和迭代
-
第 5 天综述笔记 3 基于深度学习的十大细分模型类别(下)
-
深度学习基础入门 [VI]:模型调整、学习率设置(预热、损失自适应衰减等)、批量大小调整技术、基于方差的放缩初始化方法。
-
[姿势估计] 实践记录:使用 Dlib 和 mediapipe 进行人脸姿势估计 - 本文重点介绍方法 2):方法 1:基于深度学习的方法:。 基于深度学习的方法:基于深度学习的方法利用深度学习模型,如卷积神经网络(CNN)或递归神经网络(RNN),直接从人脸图像中学习姿势估计。这些方法能够学习更复杂的特征表征,并在大规模数据集上取得优异的性能。方法二:基于二维校准信息估计三维姿态信息(计算机视觉 PnP 问题)。 特征点定位:人脸姿态估计的第一步是通过特征点定位来检测和定位人脸的关键点,如眼睛、鼻子和嘴巴。这些关键点提供了人脸的局部结构信息,可用于后续的姿势估计。 旋转表示:常见的旋转表示方法包括欧拉角和旋转矩阵。欧拉角通过三个旋转角度(通常是俯仰、偏航和滚动)描述头部的旋转姿态。旋转矩阵是一个 3x3 矩阵,表示头部从一个坐标系到另一个坐标系的变换。 三维模型重建:根据特征点的定位结果,三维人脸模型可用于姿势估计。通过将人脸的二维图像映射到三维模型上,可以估算出人脸的旋转和平移信息。这就需要建立人脸的三维模型,然后通过优化方法将模型与特征点对齐,从而获得姿势估计结果。 特征点定位 特征点定位是用于检测人脸关键部位的五官基础部分,还有其他更多的特征点表示方法,大家可以参考我上一篇文章中介绍的特征点检测方案实践:人脸校正二次定位操作来解决人脸校正的问题,客户在检测关键点的代码上略有修改,坐标转换部分客户见上图 def get_face_info(image). img_copy = image.copy image.flags.writeable = False image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) results = face_detection.process(image) # 在图像上绘制人脸检测注释。 image.flags.writeable = True image = cv2.cvtColor(image, cv2.COLOR_RGB2BGR) box_info, facial = None, None if results.detections: for detection in results. for detection in results.detections: mp_drawing.Drawing.detection = 无 mp_drawing.draw_detection(image, detection) 面部 = detection.location_data.relative_keypoints 返回面部 在上述代码中,返回的数据是五官(6 个关键点的坐标),这是用 mediapipe 库实现的,下面我们可以尝试用另一个库:dlib 来实现。 使用 dlib 使用 Dlib 库在 Python 中实现人脸关键点检测的步骤如下: 确保已安装 Dlib 库,可使用以下命令: pip install dlib 导入必要的库: 加载 Dlib 的人脸检测器和关键点检测器模型: 读取图像并将其灰度化: 使用人脸检测器检测图像中的人脸: 对检测到的人脸进行遍历,并使用关键点检测器检测人脸关键点: 显示绘制了关键点的图像: 以下代码将参数 landmarks_part 添加到要返回的关键点坐标中。
-
基于深度学习的高精度海洋生物检测与识别系统(PyTorch+Pyside6+YOLOv5 模型)
-
基于深度学习的常见车辆模型识别系统(网络版 + YOLOv8/v7/v6/v5 代码 + 训练数据集)
-
NeurIPS 2022 | 首个标有详细解释的多模态科学问答数据集,利用思维链的深度学习模型推理 (1)