摘要
深海潜水器的视野通常有限,仅凭单个视野的视频图像难以全面地观察周围海底情况, 这为研究人员了解海底底质的整体分布增加了难度.针对上述问题, 提出了一种基于深海潜水器影像的海底底质图像快速拼接方法. 首先,基于通道补偿的图像增强技术对视频帧的红色通道进行校正,并进行亮度增强和CLAHE处理.接着,利用CUDA加速的SURF算法提取特征点和描述符, 利用KD树算法初步匹配前后帧的特征点.然后,采用KNN分类算法消除误匹配, 对筛选后的匹配点进行帧间运动估计,通过变换矩阵生成底图并拼接前后帧. 最后, 融合特征点坐标与帧间运动信息. 重复上述过程,生成连续的拼接图像. 实验验证采用“蛟龙号”在某航次获取的视频图像进行拼接处理,结果表明该方法具有较好的拼接效果, 验证了其技术的可行性.
深海底质是深海生态系统和地质环境的重要组成部分, 蕴藏着丰富的生态、地质与资源等信息. 载人潜水器作为深海探测的常规手段, 在深海底质研究中起到了重要作
在水下图像拼接领域, 国内外已有大量研究. 在国外,Haywoo
通常情况下, 对于深海视频数据中底质信息的提取为离线进行, 但由于数据量过于庞大, 实时性对于拼接方法依然十分重要. 因此, 本文基于深潜器抵近海底进行走航观测的特点, 将所拍摄视频的维度近似为二维平面, 依据深海成像模型对视频图像进行预处理, 对相邻取样帧进行特征点检测与匹配后, 用计算量较小的平移变换方法进行图像拼接, 并改进了取样帧之间的拼接逻辑, 兼顾拼接的实时性与准确性. 该方法以深潜器拍摄到的底质视频为输入, 输出海底底质图像的全景大图, 实现了端到端的视频数据处理, 为研究人员通过深潜器挖掘深海底质信息提供了一种有效的框架.
1 方法流程
基于潜水器所拍摄到的深海底质视频, 本文设计了一种快速且高质量的深海底质图像拼接处理方法, 旨在为研究人员提供更直观的科研信息. 首先, 依据潜水器的速度信息设定视频帧的取样间隔, 基于深海人工光源下的成像模型对视频帧进行预处理. 其次, 使用CUDA加速的SURF算法提取特征点, 并采用KD树算法进行特征点匹配. 然后, 采用KNN分类算法对异常匹配进行筛选, 估计前后取样帧之间的平移向量, 进而得到后帧平移变换后的拼接大图. 本文方法的整体流程如

图1 本文方法流程图
Fig.1 Flow chart of this paper method
2 图像预处理
在深海图像拼接工作中, 特征点的数量与鲁棒性极为重要, 直接影响着图像配准的质量. 然而, 在深海场景下几乎没有自然光线, 水下成像高度依赖于人工光源, 这导致深海图像存在色彩失真、对比度低等问题, 难以稳定地提取高质量特征点. 根据Jaffe-McGlamery水下成像模
(1) |
式中:I为实际图像,P为真实图像,r为光的透射率, B为背景光,c为颜色通道.
通常情况下红光波长相对较长,更容易被水分子吸收和散射,导致其在水中传播的透射率r较低.因此,在深海成像模型中, 红光往往会发生更强烈的衰减,使得深海图像呈现出蓝绿色调,导致图像色彩失真.此外,背景光的不均匀分布会导致图像部分区域出现阴影,进而影响图像的亮度与对比度.
针对上述分析的问题, 本文提出了一种深海场景下基于通道补偿的图像增强的方法, 以获得具有高质量特征点的图像. 具体步骤如下:
step1:基于绿色通道对红色通道进行补偿, 解决图像的色彩失真问题.
step2:将图像转换到YUV颜色空间, 对Y通道进行直方图均衡化, 提高图像的亮度与对比度.
step3:将图像转换到RGB颜色空间,采用CLAHE(contrast limited adaptive histogram equalization)算法处理图像的RGB三通道,进一步修复图像中的细节信息, 得到增强后的图像.
2.1 红色通道补偿
随着光在水中传输距离的增加, 不同颜色的光由于波长的差异会发生不同程度的衰减, 导致图像色偏严重. 相对而言, 与蓝绿通道相比, 红色通道在水下损失较大. 因此, 需要增强图像的红色通道, 通过补偿红色通道来减小光线透射率对成像的影响. 由于图像中的不同像素点光衰减程度不一, 若对图像的红色通道进行整体线性补偿会导致颜色分布不均. 而在灰度世界法的假设下, 所有通道衰减前的均值相同, 绿光在水中衰减程度较小, 因此本文基于绿色通道对红色通道进行校正:
(2) |
式中:Yr1(x)和Yr2(x)分别表示补偿前后的红色通道值;Yg(x)表示图像的绿色通道值;k表示调节红色通道补偿效果的增益系数, 经试验可知在本文数据中取0.3时补偿效果较好;为红绿两通道的比例项, 以两通道的偏差为参考对红色通道进行校正, 使得可以动态补偿每个像素点的红色损失.
2.2 直方图均衡化
深海中物体对光线的反射和漫射能力较弱,即使有光线照射到物体表面,也很难形成足够明亮的反射, 从而降低了图像的亮度和对比度,进而造成图像清晰度低、纹理特征差.针对这一问题,本方法首先将图像转为YUV颜色空间,对亮度分量Y进行全局直方图均衡化,然后将图像转换到RGB颜色空间, 对RGB三通道进行CLAHE处理,从而得到亮度与对比度增强后的图像.
YUV颜色空间将亮度信息与色度信息分开存储,进而指定像素的颜色,其中Y为亮度,即灰阶值,U和V为色度,用以描述图像色彩及饱和度,其与RGB模型的转换关系如
(3) |
式中:Y, U, V和R, G, B分别表示YUV和RGB颜色空间的分量. 对亮度分量Y进行全局直方图均衡化:
(4) |
式中: Sk表示均衡后的像素值;rk表示原始图像中的像素值;T(rk)表示rk经过直方图均衡化后的新像素值;L表示灰度级的总数;P(rj)表示原始图像中像素值rj所占的比例;nj表示原始图像中具有灰度级j的像素数量; N表示图像的总像素数量.
通过计算前k个像素值的频率之和得到其映射关系,将原始图像中的像素值rk映射到均衡后的像素值Sk. 为累积分布函数, 表示灰度级小于或等于rk的像素值在图像中出现的概率. 将累积分布函数乘以(L-1), 使得新像素值Sk映射到从0到(L-1)的灰度级范围内. 在进行全局直方图均衡化之后, 较低频率的像素值被映射到较低的新像素值, 而较高频率的像素值被映射到较高的新像素值, 从而使得亮度值分布更加平均, 实现对亮度分布的调整.
深海环境下的图像往往受到照明条件的限制, 存在大片暗区和亮区, 具有较大的局部对比度变化. 传统的全局直方图均衡化会导致一些局部区域的对比度被过度增强, 使得图像的某些细节信息丢失, 而CLAHE能够根据图像的局部特征进行自适应的直方图均衡化, 因此能够更好地保存图像局部细节和特征, 同时提高局部区域的对比度, CLAHE算法步骤如下:
1)将图像分为大小相同且互不重叠的m×n个子块.
2)将每个子块的像素个数均匀分配给各灰度级, 得到各灰度级平均分配的像素个数Na, 计算公式如
(5) |
式中:Nx和Ny分别为各子块在x和y方向上的像素个数;Ng表示子块的灰度级数. 实际裁剪阈值T为:
(6) |
式中:Nc为裁剪限制系数, 限制各灰度级平均分配的像素个数Na的Nc倍不超过阈值T.
3)基于阈值T裁剪各子块的灰度直方图, 将多余像素划分到灰度直方图的各个灰度级中:
(7) |
式中:A为各灰度级均分到的像素数量;S为裁剪到的像素总数.采用以下过程进行像素重分配:
if P(i)>T:
P(i)=T
elif P(i)+A>T and P(i)<T:
P(i)=T
else:
P(i)+=A
其中, P(i)表示重分配前第i个灰度级的像素个数.
由于原始图像的像素值分布不均匀, 以及重分配算法的特性, 难以保证所有像素点都能准确地映射到新的灰度级上, 因此需要对像素进行循环分配, 直到剩余像素为0, 从而得到新的直方图.
4)对各子块的直方图分别进行均衡化处理.
5)以各子块中心点的灰度值为参考值, 采用双线性插值法对图像中不同子块的像素进行处理, 消除图像的块状效应.其中,红色部分采用其子块的变换函数进行灰度映射,绿色部分参考两个相邻子块进行线性插值,紫色部分则参考四个相邻子块进行双线性插值. 过程如

图2 双线性插值过程
Fig.2 Bilinear interpolation procedure
3 底质图像拼接
潜水器走航时视角并不完全固定,且帧间的特征点匹配效果与两帧的重叠面积呈负相关,若选取帧的间隔较大很容易造成误差累积,引发拼接图像畸变, 而选取帧的间隔较小则会增加处理时间.因此, 本方法结合潜水器中速度传感器的历史数据, 依据视频对应拍摄时间下的潜水器速度信息,在拼接前选取合适的间隔提取视频帧进行后续处理.本文的图像拼接流程包括特征提取,特征匹配,计算图像变换关系和图像映射.在图像的特征提取与特征匹配阶段, 本文采用OpenCV提供的SURF算法的CUDA版本提取图像特征点与描述符.相较于SIFT特征提取算法, SURF利用积分图像和Haar小波响应的优势, 改进了特征点的提取方式,在计算效率上具有很大的优势. 为建立两帧之间的初步关联,使用KD树算法找出初步可匹配的特征点对.通常情况下, 初步匹配点对存在大量误匹配,因此需要筛选出异常点并剔除, 进而计算图像的几何变换矩阵. 本文选用KNN分类算法剔除误匹配点对, 同时计算正常点对分别在x, y方向的平均位移向量tx和ty, 即帧间运动估计向量, 通过
(8) |
在完成图像变换关系的计算后, 基于当前帧的平移变换矩阵M生成拼接所需的底图, 并将当前帧缝合到底图上, 完成图像映射. 重复上述拼接流程, 得到拼接全景图.
此外, 随着所处理帧数的增加, 计算资源与内存空间的不足会严重影响拼接处理的实时性. 因此, 本文改进了拼接逻辑, 提出了一种基于传递特征点坐标向量的增量式图像拼接方法, 将帧间运动估计向量融合到特征点的坐标向量, 从而实现每次拼接时只和上一帧进行图像配准, 大大降低了计算复杂度.
3.1 帧间运动估计
KNN是一种简单有效的非参数化分类算法, 具有无须模型训练的特点, 适用于低维数据. 在得到初步的匹配结果后, 假设待测数据为t, 已知样本为k,通过
(9) |
经过上述步骤,得到在点群中筛选后的平移向量,反向推理得到KNN筛选后的特征匹配点对. 对筛选后的向量坐标取均值, 得到基于上一帧坐标原点的下一帧运动估计向量, 进而求得平移变换矩阵M. 最后, 采用平移变换生成拼接所需的底图,并利用运动估计结果将相邻帧在底图上进行叠加,从而快速生成连续的拼接图像.如

(a) 离群点剔除

(b) 计算运动估计向量
图3 离群点剔除并计算运动估计向量
Fig.3 Outliers are eliminated and motion estimation vectors are calculated
3.2 增量式图像拼接
传统拼接方法在拼接时, 需要重新对当前帧和已拼接大图进行特征点检测和匹配, 随着拼接进程的进行, 所需处理的特征点数量增加, 图像变换矩阵的求解速度降低, 从而导致计算冗余和误差累积, 严重影响拼接的质量与实时性. 针对这一问题, 本文设计了一种基于传递特征点坐标向量的增量式图像拼接方法,通过融合帧间运动估计向量与特征点坐标信息,不断更新上一帧特征点在拼接大图中的坐标,省去了新一轮拼接时需要在已拼接大图上重新搜索特征点的过程,大幅提升了拼接效率, 降低了误差传递的可能性, 具体流程如

图4 增量式拼接流程图
Fig.4 Incremental splicing flow chart
如
4 实验
4.1 实验环境
本文实验的操作系统为Windows11, CPU型号为Intel Core i5-12500H, 内存为16 GB, GPU为NVIDIA GeForce RTX 3060, 显存为6 GB, 编译语言为Python 3.7, 编程平台为PyCharm, 所用OpenCV版本为4.5.4, CUDA版本为11.3.
4.2 实验数据
本文实验数据采用2014年7月“蛟龙号”在采薇海山及周边海域拍摄的高清视频, 由于相机拍摄时, 视野中长时间存在采样设备等遮挡物, 影响特征点匹配, 因此首先对原始视频进行预处理, 处理后的视频参数如
时长/s | 分辨率 | 帧率/(帧· | 格式 | 编码方式 | 色彩空间 |
---|---|---|---|---|---|
40 | 1 500x876 | 25 | MP4 | H.264 | RGB |

图5 实验视频部分图像
Fig.5 Partial images of experimental video
4.3 图像预处理实验
4.3.1 定性分析
选取实验视频中的4帧进行实验,

图6 各步骤图像增强结果
Fig.6 Image enhancement results of each step
(a)原图 (b)step1 (c) step2 (d) step3
4.3.2 定量分析
特征点数量是评价图像增强效果的客观评价指标之一,也是图像拼接工作的前提.为了验证所提算法对深海底质图像的特征修复能力,本文采用SURF特征检测算法,对增强前后图像所提取的特征点数量进行实验. 实验结果可视化如

图7 图像增强前后特征点分布
Fig.7 Distribution of feature points before and after image enhancement
由
image | 原图 | MSRCR | AGCIE | JHE | 本文算法 |
---|---|---|---|---|---|
1 | 1 029 | 3 607 | 4 619 | 7 725 | 9 794 |
2 | 1 608 | 5 815 | 2 007 | 8 080 | 10 223 |
3 | 2 671 | 6 917 | 6 345 | 8 520 | 10 222 |
4 | 2 229 | 7 695 | 4 982 | 9 295 | 10 950 |
平均 | 1 885 | 6 009 | 4 988 | 8 405 | 10 297 |
除此之外, 为了进一步评估增强前后图像的质量变化情况, 本文引入了多种客观评价指标来量化本文所提图像增强算法的效果, 其中包括水下图像质量度量(underwater image quality measurement, UIQM
Image | 原图 | MSRCR | AGCIE | JHE | 本文算法 |
---|---|---|---|---|---|
1 | 0.015 | 0.226 | 0.290 | 0.572 | 0.861 |
2 | 0.125 | 0.425 | 0.218 | 0.571 | 0.892 |
3 | 0.110 | 0.301 | 0.283 | 0.675 | 0.938 |
4 | 0.093 | 0.493 | 0.303 | 0.663 | 0.962 |
Image | 原图 | MSRCR | AGCIE | JHE | 本文算法 |
---|---|---|---|---|---|
1 | 0.406 | 0.445 | 0.447 | 0.524 | 0.533 |
2 | 0.431 | 0.462 | 0.393 | 0.526 | 0.532 |
3 | 0.401 | 0.458 | 0.423 | 0.526 | 0.529 |
4 | 0.425 | 0.469 | 0.441 | 0.525 | 0.532 |
Image | 原图 | MSRCR | AGCIE | JHE | 本文算法 |
---|---|---|---|---|---|
1 | 5.848 | 5.739 | 7.082 | 7.721 | 7.954 |
2 | 6.275 | 6.231 | 6.375 | 7.816 | 7.955 |
3 | 6.028 | 6.270 | 7.005 | 7.732 | 7.953 |
4 | 6.073 | 6.330 | 7.106 | 7.799 | 7.965 |
图像预处理阶段会对整个方法架构的实时性产生一定影响, 因此, 对不同算法处理实验图像的所用时间进行对比实验, 以验证所提方法的实时性. 由
Image | MSRCR | AGCIE | JHE | 本文算法 |
---|---|---|---|---|
1 | 11.56 | 0.02 | 1.37 | 0.04 |
2 | 10.73 | 0.03 | 1.37 | 0.04 |
3 | 10.87 | 0.02 | 1.39 | 0.04 |
4 | 11.16 | 0.03 | 1.39 | 0.04 |
总时长 | 44.32 | 0.10 | 5.52 | 0.16 |
4.4 图像拼接实验
根据上述流程, 结合图像预处理与拼接方法对实验数据进行处理, 得到最终的拼接大图. 本研究旨在使研究人员可以快速直观地看到某个区域的全貌, 因此本文采用主观评价的方式评估拼接效果, 并计算拼接所用时间验证其快速性. 设定拼接的帧取样间隔i为3, 以预处理后的视频为输入, 从读取视频的第一帧开始计时, 最后一帧拼接完成后结束计时, 得到最终的全景拼接大图.
拼接结果如

图8 拼接结果
Fig.8 Stitching result
5 总结与展望
针对深海潜水器搭载相机所拍摄的底质视频, 本文提出了一种快速且高质量的图像拼接方法. 该方法首先结合深海光源下的成像模型, 基于采样帧的绿色通道对红色通道进行补偿, 进而将图像转换到YUV颜色空间, 对Y分量进行全局直方图均衡化, 最后将图像转换到RGB颜色空间, 采用CLAHE方法处理R, G, B分量, 得到增强后的图像. 在此基础上, 使用CUDA加速的SURF算法提取特征点, 并利用KD树算法进行初匹配. 采用KNN算法分离异常匹配点对,根据正常点对的位移向量进行帧间运动估计.针对拼接过程中的误差累计与计算资源浪费问题,设计了一种基于传递特征点坐标向量的增量式拼接方法,重复流程后得到拼接结果. 该方法实现了从视频数据到深海底质全景大图的完整拼接处理流程,并通过实验验证了该方法在深海底质信息处理中的可行性和有效性.
但是,本文所提方法仍存在一定局限性, 例如, 当人工光源与拍摄目标的距离有较大变化时, 需要重新对调节红色通道补偿效果的增益系数k进行人工调参,从而降低该方法的实时性, 后续研究将考虑具有较强实时性的自适应图像增强方法, 使研究人员可以得到更加清晰、连贯的海底地质信息, 进一步节省人工操作的时间与精力, 为深海勘探和研究提供更完整的数据.
参考文献
COLLOT J Y,LALLEMAND S,PELLETIER B,et al.Geology of the d’Entrecasteaux-new Hebrides arc collision zone:results from a deep submersible survey[J].Tectonophysics,1992,212(3/4):213-241. [百度学术]
曹贝贝.海底光学图像拼接方法研究[D].大连:大连海事大学,2017. [百度学术]
CAO B B.Research on stitching method of submarine optical images[D].Dalian:Dalian Maritime University,2017.(in Chinese) [百度学术]
BARREYRE T,ESCARTÍN J,GARCIA R,et al.Structure,temporal evolution,and heat flux estimates from the Lucky Strike deep-sea hydrothermal field derived from seafloor image mosaics[J].Geochemistry,Geophysics,Geosystems,2012,13(4). [百度学术]
HAYWOOD R.Acquisition of a micro scale photographic survey using an autonomous submersible[C]//OCEANS '86.September 23-25,1986,Washington,DC,USA:IEEE,1986:1423-1426. [百度学术]
MARKS R L,ROCK S M,LEE M J.Real-time video mosaicking of the ocean floor[C]//Proceedings of IEEE Symposium on Autonomous Underwater Vehicle Technology (AUV'94).July 19-20,1994,Cambridge,MA,USA:IEEE,1994:21-27. [百度学术]
LEONE A,DISTANTE C,MASTROLIA A,et al.A fully automated approach for underwater mosaicking[C]//OCEANS.September 18-21,2006,Boston,MA,USA:IEEE,2006:1-6. [百度学术]
ELIBOL A,KIM J,GRACIAS N,et al.Efficient image mosaicing for multi-robot visual underwater mapping[J]. Pattern Recognition Letters,2014,46:20-26. [百度学术]
JATMIKO D A,PRINI S U.Study and performance evaluation binary robust invariant scalable keypoints (BRISK) for underwater image stitching[J].IOP Conference Series:Materials Science and Engineering,2020,879(1): 012111. [百度学术]
贺彬,王国宇.不同视点海底图像拼接算法[J].微计算机信息,2005,21(26):152-154. [百度学术]
HE B, WANG G Y. Multi-perspective marine terrain image mosaic[J].Control & Automation,2005,21(26):152-154.(in Chinese) [百度学术]
谢雨来,李醒飞,吕津玮,等.基于SURF算法的水下图像实时配准方法[J].计算机辅助设计与图形学学报,2010,22(12):2215-2220. [百度学术]
XIE Y L,LI X F,LÜ J W,et al.Underwater images real-time registration method based on SURF[J].Journal of Computer-Aided Design & Computer Graphics,2010,22(12):2215-2220.(in Chinese) [百度学术]
王昕平,张森林,刘妹琴,等.基于多尺度图像融合和SIFT特征的水下图像拼接研究[J].计算机应用与软件,2021,38(5):213-217. [百度学术]
WANG X P,ZHANG S L,LIU M Q,et al.Underwater image stitching based on multi-scale image fusion and sift feature[J].Computer Applications and Software,2021,38(5):213-217.(in Chinese) [百度学术]
欧阳婷.水下图像拼接与海底多金属结核检测方法研究[D].哈尔滨:哈尔滨工程大学,2021. [百度学术]
OUYANG T.Research on underwater image mosaic and detection method of seabed polymetallic nodules[D].Harbin:Harbin Engineering University,2021.(in Chinese) [百度学术]
MCGLAMERY L B. A computer model for underwater camera systems[J]. Society of Photo-Optical Instrumentation Engineers, 1980, 208(208): 221-231. [百度学术]
PANETTA K,GAO C,AGAIAN S.Human-visual-system-inspired underwater image quality measures[J].IEEE Journal of Oceanic Engineering,2016,41(3):541-551. [百度学术]
YANG M,SOWMYA A.An underwater color image quality evaluation metric[J].IEEE Transactions on Image Processing,2015, 24(12): 6062-6071. [百度学术]