二维和三维数据增强方法及 Python 代码 - I. 数据增强方法

最编程 2024-03-20 18:18:58

...

1、数据裁剪（Crop）对输入图像中的一部分区域进行裁剪，之后将裁减出的区域进行缩放为图像尺寸大小。

2、数据缩放（Scale）对输入图像进行一定比例的放大或缩小，图像放大之后通常需要对超出图像尺寸的部分进行裁剪，图像缩小之后通常需要对不足图像尺寸的部分进行补足（Padding）。

3、数据平移（Translation）对输入图像沿着X或Y方向进行移动，这对于黑色背景的目标非常有利，相当于目标在图像范围内进行了随机平移。

4、数据旋转（Rotation）对输入图像进行一定角度的中心旋转，对于常规的矩形图像，只有旋转180度的倍数才能保证图像尺寸不变。

5、数据翻转（Flip）对输入图像进行水平或垂直翻转。

6、颜色增强对输入图像的某个颜色空间增加或减少某些颜色分量，或者改变颜色通道的顺序。

7、数据噪声（Noise）对输入图像叠加高斯噪声或椒盐噪声。