YOLO 系列] YOLOv6 论文超详细解读(译文+学习笔记)--IV.结论 - 结论
翻译
简而言之,考虑到持续的工业需求,我们提出了YOLOv6的当前形式,仔细研究了迄今为止物体探测器组件的所有进步,同时灌输了我们的思想和实践。其结果在精度和速度上都超过了其他可用的实时检测器。为了方便工业部署,我们还为YOLOv6提供了定制的量化方法,使其成为开箱即用的快速检测器。我们衷心感谢学术界和工业界的杰出想法和努力。未来,我们将继续扩大该项目,以满足更高的标准和更苛刻的场景。
精读
YOLOv6在精度和速度上都超过了其他可用的目标检测器。为了方便工业部署,作者还为YOLOv6提供了定制的量化方法,使其成为开箱 即用的快速检测器。
解决的问题
(1)RepVGG提出的结构重参数化方法表现良好,但在此之前没有检测模型使用。作者认为RepVGG的block缩放不合理,小模型和大模型
(2)没必要保持相似网络结构;小模型使用单路径架构,大模型就不适合在单路径上堆参数量。
(3)使用重参数化的方法后,检测器的量化也需要重新考虑,否则因为训练和推理时的结构不同,性能可能会退化。
(4)前期工作很少关注部署。前期工作中,推理是在V100等高配机器完成的,但实际使用时往往用T4等低功耗推理gpu,作者更关注后者
的性能。
(5)针对网络结构的变化,重新考虑标签分配和损失函数。
(6)对于部署,可以调整训练策略,在不增加推理成本的情况下提升性能,如使用知识蒸馏。
主要贡献
(1)在不同的工业落地场景下,设计了不同的模型,兼顾精度与速度。其中,小模型为单分支,大模型为多分支。
(2)在分类和回归任务上都使用自蒸馏策略,动态调整教师模型和标签,便于学生模型的训练。
(3)分析了各种标签分配、损失函数和数据增强技术,选择合适的策略进一步提升性能。
(4) 基于RepOptimizer优化器和通道蒸馏,对量化方式做了改进。
未来完善
1. 完善 YOLOv6 全系列模型,持续提升检测性能。
2. 在多种硬件平台上,设计硬件友好的模型。
3. 支持 ARM 平台部署以及量化蒸馏等全链条适配。
4. 横向拓展和引入关联技术,如半监督、自监督学习等等。
5. 探索 YOLOv6 在更多的未知业务场景上的泛化性能。
本文参考:
YOLOv6:又快又准的目标检测框架开源啦 - 美团技术团队 (meituan.com)