Python 第三方模块之 imgaug - 图像 augmentation
imgaug 是一个封装好的用来进行图像augmentation的python库,支持关键点(keypoint)和bounding box一起变换。
- 项目主页: imgaug doc
- Git: https://github.com/aleju/imgaug
1. 安装和卸载
1 |
|
2. 示例
2.1 基本使用
首先定义一个变换序列,然后直接将图像batch传入即可:
1 |
|
2.2 包含常用的变换示例
1 |
|
3 Augmenters常用函数
先导入Augmenters类
1 |
|
3.1 iaa.Sequential()
产生一个处理图片的 Sequential 函数原型:
1 |
|
参数:
- children: 想要应用在图像上的Augmenter或者Augmenter集合。默认None
- random_order: bool类型, 默认False。是否对每个batch的图片应用不同顺序的Augmenter list。当设置为True时,不同batch之间图片的处理顺序都会不一样,但是同一个batch内顺序相同。
- deterministic: bool类型, 默认False。
3.2 iaa.someOf()
将Augmenter中的部分变换应用在图片处理上,而不是应用所有的Augmenter。例如:可以定义20种变换,但每次只选择其中的5个。但是不支持固定选择某一个Augmenter。
函数原型:
1 |
|
参数:
- n: 从总的Augmenters中选择多少个。可以是一个int, tuple, list或者随机值。
- random_order: 是否每次顺序不一样。
例子:
1 |
|
3.3 iaa.OneOf()
每次从一系列Augmenters中选择一个来变换。
1 |
|
参数含义与上面一样。
3.4 iaa.Sometimes()
对batch中的一部分图片应用一部分Augmenters,剩下的图片应用另外的Augmenters。
1 |
|
- p: float。多大比例的图片会被 Augmente。
- then_list: Augmenter集合。p概率的图片进行变换的Augmenters。
- else_list: 1-p概率的图片会被进行变换的Augmenters。注意变换的图片应用的Augmenter只能是then_list或者else_list中的一个。
3.5 iaa.WithColorspace()
在某个特定的颜色空间对图像进行变换。即:先将图片从一个颜色空间变换到另一个颜色空间,然后在另一个颜色空间中对图像进行变换,最后再变换回原来的颜色空间。
1 |
|
- to_colorspace: 要变换的颜色空间。有以下选择:RGB, BGR, GRAY, CIE, YCrCb, HSV, HLS, Lab, Luv
- from_colorspace: 原来的颜色空间, 默认RGB。
- children: 要执行的变换。
1 |
|
3.6 iaa.WithChannels()
从图片中挑选出一个Channel来进行变换,变换完了之后再将该channel merge回去。
1 |
|
参数:
- channels: int或者int list。哪些channel要被用来变换。
- children: channel被选出来之后要进行哪些变换。
3.7 iaa.Noop()
不进行任何变换。某些情况下只想使用一个Augmenter作为占位符,这样可以继续调用augment_image()函数,但实际不作变换。例如进行测试的时候可以使用这个。
3.8 iaa.Lambda()
自定义一些变换函数。
1 |
|
参数:
- func_images: 对每一个image调用此函数。该函数必须返回变换后的图片。该函数的形式为:
1 |
|
- func_keypoints: 对每个图像的关键点进行变换的函数。该函数返回变换后的keypoint。该函数形式为:
1 |
|
例子:
1 |
|
将每张图片没隔两行的像素点变成黑色的条带,关键点保留。
3.9 iaa.AssertShape()
assert要变换的图片和keypoint的shape。如果不满足就抛出异常。
1 |
|
参数:
- shape: 元组,通常形式为(N, H, W, C)。元组中每个元素的值可以为:None, int, 两个int类型的tuple或者一个int类型的list。如果是None,表示所有值都可以接受。如果是int,则只有对应的位置是该值才会被接受。如果是int类型的tuple,例如(a,b),则对应位置的值必须是a<=x
1 |
|
3.10 iaa.Scale()
将图像缩放到固定大小。
1 |
|
参数:
- size: 字符串”keep”,此时保持图像原大小不坐缩放。如果是一个整数n,则缩放成(n, n)。如果是一个float v,则每张图片会被缩放成(H*v, W*v),此时每张图像大小仍然不一样。如果是一个tuple类型(a, b), 如果a、b中至少有一个小数,则从[a,b]中挑选一个数作为缩放比例。如果a、b都是整数,则从[a,b]中挑选一个整数作为缩放后的大小。如果是1个list,则list中的数要么全是整数,要么全是小数(不能混用)。如果是一个dict类型,则该dict必须有两个key: height和width。每个key的值仍然可以按照上面的方法选取。此外, key的值还可以是”keep-aspect-ratio”, 表示按照比例缩放。
- interpolation: 缩放方法。如果是All, 则会随机从下面挑选一个: nearest、linear、area、cubic,注意每张图片可能不一样。如果是int,则应该是下面的一种:cv2.INTER_NEAREST, cv2.INTER_LINEAR, cv2.INTER_AREA,cv2.INTER_CUBIC。如果是string,则该种方法会被一直使用,必须是下面的一种:
nearest, linear, area, cubic
。如果是int list或者string list, 则每张图片会从中随机选取一个。
3.11 iaa.CropAndPad()
截取(crop)或者填充(pad),填充时,被填充区域为黑色。
1 |
|
参数:
- px: 想要crop(negative values)的或者pad(positive values)的像素点。注意与percent不能同时存在。如果是None, pixel级别的crop不会被使用。int或者int list与上面相同。如果是一个4个元素的tuple,那么4个元素分别代表(top, right, bottom, left),每个元素可以是int或者int tuple或者int list。
- percent:按比例来crop或者pad, 与px相同。但是两者不能同时存在。
- pad_mode: 填充方式。可以是All, string, string list。可选的填充方式有:
constant, edge, linear_ramp, maximum, median, minimum, reflect, symmetric, wrap
。具体含义可查numpy文档。 - pad_cval:
float、int、float tuple、int tuple、float list、int list
。当pad_mode=constant的时候选择填充的值。 - keep_size: bool类型。经过crop后,图像大小会改变。如果该值设置为1,则在crop或者pad后再缩放成原来的大小。
- sample_independently : bool类型。如果设置为False,则每次从px或者percent中选出来的值会作用在四个方位。
3.12 iaa.Pad()
与iaa.CropAndPad()相同,只接受positive values。
3.13 iaa.Crop()
与iaa.CropAndPad()相同,只接受negative values。
3.14 iaa.Fliplr()
水平镜面翻转。
1 |
|
参数:
- p: int或者float,每张图片呗翻转的概率
3.15 Flipud()
上下翻转,与上面相同。
3.16 iaa.ChangeColorspace()
改变图像空间。
1 |
|
参数:
- to_colorspace: 见上。
- from_colorspace: 见上。
- alpha: 覆盖旧的颜色空间时,新颜色空间的Alpha值。为
int, float, int tuple, float tuple
。
3.17 iaa.Grayscale()
变成灰度图。
1 |
|
参数:
- alpha: 覆盖旧的颜色空间时,新颜色空间的Alpha值。
3.18 iaa.GaussianBlur()
高斯扰动。
1 |
|
参数:
- sigma: 高斯变换的标准差。可为
float, float tuple
。常见的有0,不扰动。3,强扰动。
3.19 iaa.AverageBlur()
从最邻近像素中取均值来扰动。
1 |
|
参数:
- k:窗口大小。可为
int, int tuple
。当为int tuple
时,如果每个元素也是tuple
,每个元素分别作为height和width,窗口大小不一致。
3.20 iaa.MedianBlur()
通过最近邻中位数来扰动。
1 |
|
与上面相同。
3.21 iaa.Convolve()
对图像使用卷积。
1 |
|
- matrix: 卷积矩阵。
3.22 iaa.Sharpen()
锐化。
1 |
|
3.23 iaa.Emboss()
浮雕效果。
1 |
|
3.24 iaa.EdgeDetect()
边缘检测。
1 |
|
3.25 iaa.DirectedEdgeDetect()
特定方向的边缘检测。
1 |
|
3.26 iaa.Add()
随机加上一个值。
1 |
|
3.27 iaa.AddElementwise()
按像素加。
1 |
|
3.28 iaa.AdditiveGaussianNoise()
添加高斯噪声。
1 |
|
3.29 iaa.Multiply()
给图像中的每个像素点乘一个值使得图片更亮或者更暗。
1 |
|
3.30 iaa.MultiplyElementwise()
按像素值乘。
1 |
|
3.31 iaa.Dropout()
随机去掉一些像素点, 即把这些像素点变成0。
1 |
|
3.32 iaa.CoarseDropout()
将矩形框的值设置为0。
1 |
|
3.33 iaa.Invert()
将每个像素值p变成255-p。
1 |
|
3.34 iaa.ContrastNormalization()
改变图像的对比度。
1 |
|
3.35 iaa.Affine()
仿射变换。包含:平移(Translation)、旋转(Rotation)、放缩(zoom)、错切(shear)。仿设变换通常会产生一些新的像素点,我们需要指定这些新的像素点的生成方法,这种指定通过设置cval
和mode
两个参数来实现。参数order
用来设置插值方法。
1 |
|
参数:
- scale: 图像缩放因子。1表示不缩放,0.5表示缩小到原来的50%。此参数可以是
float, float tuple, dict
。如果是float
, 则所有图片按照这种比例缩放。如果是float tuple
, 则随机选取一个值来进行缩放,此时x-axis
和y-axis
的缩放比例相同。如果是一个dict
,则应该有两个key
:x, y
,每个x
或y
的值都可以是float, float tuple
,此时x-axis
和y-axis
的缩放比例不一样。 - translate_percent: 平移比例,0表示不平移,0.5表示平移50%。可以是
float, float tuple, dict
,具体含义与scale相同。用正负来表示平移方向。 - translate_px: 按照像素来进行平移。可以是
int, int tuple, dict
,具体含义与translate_percent相同。 - rotate: 平移角度,0~360度之间,正负也可以表示方向。可以为
float, float tuple
。 - shear: 错切的程度,0~360度之间,正负表示方向。可以为
float, int, float tuple, int tuple
。 - order: 插值顺序,与
skimage
中定义相同。下面0和1方法快,3比较慢,4、5特别慢。可以是int, int list, ia.ALL
。如果是ia.ALL
,则每次从所有的插值方法中随机选取。- 0:最邻近插值。
- 1: 双线性插值(默认)。
- 2: 双二次插值(不推荐)。
- 3:双三次插值。
- 4: Bi-quartic。
- 5:Bi-quintic。
- cval: 当平移后使用常量填充的时候指定填充的常量值,只有在
mode=constant
的时候才会生效。可以是int, float, tuple, ia.ALL
。如果是ia.ALL
,则会从[0,255]
之间随机选取一个值填充。 - mode: 采用何种方式填充经过变换后空白的像素点。可以是
string, string list, ia.ALL
。基本用法与上面相同。其中字符串的选取范围是:- constant: 采用一个常量填充。
- edge: 边缘填充。
- symmetric: 镜面对称填充。
- reflect: Pads with the reflection of the vector mirrored on the first and last values of the vector along each axis.
- wrap: Pads with the wrap of the vector along the axis. The first values are used to pad the end and the end values are used to pad the beginning.
3.36 iaa.PiecewiseAffine()
随机放置一些规则的网格点然后移动这些点的周围的像素。这回导致局部的扭曲。
1 |
|
3.37 iaa.ElasticTransformation()
通过移动局部像素来变换。
1 |
|
4. keypoint变换
imgaug支持在图像变换的同时变换图像中的关键点。例子如下:
1 |
|
5. Bounding Boxes变换
imgaug在图像变换的同时变换图像中的bound box。bounding的支持包括:
- 将bounding box封装成对象
- 对bounding box进行变换
- 将bounding box画在图像上
- 移动bounding box的位置,将变换后的bounding box映射到图像上,计算bounding box的IoU。
5.1 基本变换
例子如下:
1 |
|
5.2 平移bounding box
调用shift
函数即可。
1 |
|
得到的图像为:
5.3 图像有缩放时bounding box的映射
调用on
函数即可。
1 |
|
5.4 计算Intersections, Unions和IoU
1 |
|
得到的图像如下:
6. Stochastic Parameter
在做变换的时候,我们希望每张图片的变换都不一样,通过参数随机化选取可以实现。但是想要复现之前的变换,需要通过determinism
来实现,比较繁琐。为了避免这种情况,使用Stochastic Parameters
来实现。这个变量通常是一个抽象的概率分布,例如正太分布、均匀分布等等。通常所有的augmenter
都能接受这个参数,这样就很方便控制变量范围。他们都可以和determinism
结合。
例子:
1 |
|
所有可用的概率分布有:
6.1 正态分布
Normal(loc, scale): 均值为loc,标准差scale。
1 |
|
6.2 拉普拉斯分布
Laplace(loc, scale): 峰值loc, 宽度scale:
1 |
|
6.3 其他连续概率分布还有:
- 卡方分布(ChiSquare)
- 韦伯分布(Weibull)
- 均匀分布(Uniform )
- Beta分布
6.4 离散概率分布
- 二项分布(Binomial)
- 离散均匀分布(DiscreteUniform)
- 泊松分布(Poisson distribution)
6.5 对分布的数学运算
imgaug支持随机参数的算术运算。 允许修改从分布中抽取的值或者将几个分布相互组合。支持的操作有:
- Add
- Subtract
- Multiply
- Divide
- Power
6.6 特殊参数
支持的操作有:
- Deterministic
- Choice
- Clip
- Discretize
- Absolute
- RandomSign
- ForceSign
- Positive
- Negative
- FromLowerResolution
具体含义和用法见文档。
7. Blending/Overlaying images
augment会直接改变图片而把原图舍弃掉了。有时我们需要改变图像的局部,或者将原来的图片跟新变换的图片结合起来。这可以通过给变换前后的图片配上一定的权重(αα参数)或者使用一个pixel-wise的mask。
一个例子如下:
1 |
|
得到的图片为:
具体用法见文档。