(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210317817.6
(22)申请日 2022.03.29
(71)申请人 东南大学
地址 211102 江苏省南京市江宁区东 南大
学路2号
(72)发明人 李春国 罗顺 刘周勇 杨绿溪
(74)专利代理 机构 南京瑞弘专利商标事务所
(普通合伙) 32249
专利代理师 秦秋星
(51)Int.Cl.
G06V 10/80(2022.01)
G06V 10/82(2022.01)
G06V 10/774(2022.01)
G06V 10/776(2022.01)
G06V 10/26(2022.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06K 9/62(2022.01)
(54)发明名称
一种基于双边注意力机制的复杂背景下目
标检测方法
(57)摘要
本发明公开了一种基于双边注意力机制的
复杂背景下的目标检测方法, 可用于在复杂背景
下进行精确的前景目标检测。 该发明主要包括:
根据公开的复杂背景下目标检测数据集, 构建训
练集、 验证集和测试集; 构建基于双边注意力机
制的人工神经网络检测模型Bi ‑SINet; 在
Pytorch深度学习平台上运用SGD优化器优 化Bi‑
SINet模型; 在所构建的测试集上评估收敛的Bi ‑
SINet网络模型的检测性能。 本发明相比当前主
要的复杂背景下的目标检测算法SINet能取得更
好的检测性能。 本发明在降低了平均绝对误差的
同时, 实现了 更高的增强 ‑对齐指标、 结构指标及
加权的F指标, 是一种更加精确的复杂背景下的
目标检测算法。
权利要求书2页 说明书7页 附图4页
CN 114677571 A
2022.06.28
CN 114677571 A
1.一种基于双边注意力机制的复杂背景下的目标检测方法, 其特征在于, 该方法包括
如下步骤:
步骤S1: 根据公开的复杂背景 下的目标检测数据集, 构建训练集、 验证集和 测试集;
步骤S2: 构建基于双边注意力机制的Bi ‑SINet网络模型, 利用所构建的训练集对Bi ‑
SINet网络模型进行监 督训练, 直到模型收敛到最优性能;
步骤S3: 将收敛的Bi ‑SINet网络模型在所构建的测试集上进行测试, 根据检测结果评
估模型性能。
2.根据权利要求1所述一种基于双边注意力机制的复杂背景下的目标检测方法, 其特
征在于, 所述步骤S1中目标检测数据集包含数据集COD10K、 数据集CAMO和数据集
CHAMELEON。
3.根据权利要求1所述一种基于双边注意力机制的复杂背景下的目标检测方法, 其特
征在于, 所述 步骤S2具体包括:
步骤S201: 对训练数据进行预处理, 首先利用双线性插值法将原始图像大小调整为384
×384, 并调整对应的真实标签, 随后进行图像数据增强处理, 最后将图像进行归一化处理
后输入Bi ‑SINet网络模型进行训练;
步骤S202: Bi ‑SINet网络模型对输入图像进行特征提取, 随后将提取到 的多层特征输
入渐进式的检测框架中进行检测; 渐进式的检测框架会基于每层特征进行前景目标分割,
共输出N个不同尺度的检测结果, 用
来表示, k =0, 1, ..., N‑1;
步骤S203: 在训练 阶段, 采用交叉熵损失函数和交并比损失函数对模型输出的N个检测
结果进行监 督训练, 总体损失函数 可以用Loverall来表示, 其计算公式为:
其中,
表示第k层检测结果与真实标签之间的结构加权后的交叉熵损失,
则表
示第k层检测结果与真实标签之间的结构加权后的交并比损失, 它 们的计算表达式分别为:
其中, H表示图像高度, W表示图像宽度,
和maskGT(x,y)分别表示第k层预测
结果和真实标签中位置坐标为(x,y)的值, γ是和结构权重相关的参数, w(x,y)表 示坐标为
(x,y)的位置对应的结构权 重, 其表达式如下:权 利 要 求 书 1/2 页
2
CN 114677571 A
2其中, Axy表示坐标为(x,y)的像素周围像素的集 合;
步骤S204: 在训练过程中, 采用随机梯度下降优化算法对网络参数进行迭代更新, 同时
以多项式法对学习率进行衰减; 训练过程中, 间隔若干次迭代使用所构建的验证集对模型
性能进行验证, 确保模型收敛到最优性能;
步骤S205: 利用优化收敛后固定参数的Bi ‑SINet网络模型对输入的待检测图像进行前
向计算, 即可获得 前景目标分割图作为检测结果。
4.根据权利要求1所述一种基于双边注意力机制的复杂背景下的目标检测方法, 其特
征在于, 所述 步骤S3具体包括:
步骤S301: 将待检测图片归一化后, 输入收敛的Bi ‑SINet网络模型进行检测, 在输出的
N个不同尺度的检测结果中, 选择尺度最大的
作为模型的最终检测结果maskpred;
步骤S302: 根据模型的检测结果maskpred和对应的真实标签maskGT, 计算平均绝对误差
MAE, 计算公式如下:
其中, H表示图像高度, W表示图像宽度, maskpred(x,y)和maskGT(x,y)分别表示预测结果
和真实标签中位置坐标为(x,y)的值;
步骤S303: 根据模型的检测结果maskpred和对应的真实标签maskGT, 计算客观评价指标
EM, 计算公式如下:
其中, H代 表图像高度, W表示图像宽度, φFM表示增强的对齐矩阵;
步骤S304: 根据模型的检测结果maskpred和对应的真实标签maskGT, 计算客观评价指标
SM, 计算公式如下:
SM=α S0+(1‑α )Sr (7)
其中S0表示针对目标的结构相似度, Sr表示针对区域 的结构相似度, 平衡两者 的权重a
通常取值0.5;
步骤S305: 根据模型的检测结果maskpred和对应的真实标签maskGT, 计算客观评价指标
WFM, 计算公式如下:
其中Pw表示加权修正后的准确率, Rw表示加权修正后的召回率, β 是平衡准确率和召回
率的因子 。权 利 要 求 书 2/2 页
3
CN 114677571 A
3
专利 一种基于双边注意力机制的复杂背景下目标检测方法
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 07:32:46上传分享