欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

ACC-UNet - 基于变压器和 UNet 的语义分割模型 - 概述

最编程 2024-05-03 10:37:53
...

在过去十年中,计算机视觉领域经历了一场根本性的变革,这主要归功于视觉转换器(Visual Transformers)的引入。这一变革同样影响了医学成像领域,其中UNet架构通过采用转换器技术进行了重要重构,成为了该领域内极具影响力的模型之一。

近期的研究,如ConvNext,重新评估了卷积模型在视觉任务中的有效性,这一工作启发了我们对现有技术的进一步改进。我们的目标是提升传统的纯卷积UNet模型,使其在性能上能与基于Transformer的模型如Swin-Unet和UCTransNet相媲美。

在本篇综述文章中,我们深入探讨了基于Transformer的UNet模型的优势,尤其是在全局特征提取和跨层连接方面的能力。为了模拟这些优势,我们采用了卷积运算,并提出了ACC-UNet——一种完全基于卷积的UNet模型。ACC-UNet不仅继承了卷积网络的固有感应偏差,还具备了提取全局特征的能力,这使得它能够结合两种方法的优点。

在五个不同的医学图像分割基准测试中,ACC-UNet的性能始终超越了传统的卷积网络、Transformer模型以及它们的混合体。特别值得注意的是,在模态得分上,ACC-UNet分别比当前最先进的模型Swin-Unet和UCTransNet高出2.64% ± 2.54%和0.45% ± 1.61%,同时使用的参数量仅为它们的59.26%和24.24%,这表明ACC-UNet在效率和性能之间实现了卓越的平衡。

这一成果不仅展示了ACC-UNet在医学图像分割领域的潜力,也突显了通过创新的网络设计来推动技术进步的重要性。随着进一步的研究和开发,ACC-UNet及其衍生模型有望在医学成像和其他相关领域中发挥更大的作用。

论文地址:https://arxiv.org/abs/2308.13680
源码地址:https://github.com/kiharalab/acc-unet