说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210317817.6 (22)申请日 2022.03.29 (71)申请人 东南大学 地址 211102 江苏省南京市江宁区东 南大 学路2号 (72)发明人 李春国 罗顺 刘周勇 杨绿溪  (74)专利代理 机构 南京瑞弘专利商标事务所 (普通合伙) 32249 专利代理师 秦秋星 (51)Int.Cl. G06V 10/80(2022.01) G06V 10/82(2022.01) G06V 10/774(2022.01) G06V 10/776(2022.01) G06V 10/26(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) G06K 9/62(2022.01) (54)发明名称 一种基于双边注意力机制的复杂背景下目 标检测方法 (57)摘要 本发明公开了一种基于双边注意力机制的 复杂背景下的目标检测方法, 可用于在复杂背景 下进行精确的前景目标检测。 该发明主要包括: 根据公开的复杂背景下目标检测数据集, 构建训 练集、 验证集和测试集; 构建基于双边注意力机 制的人工神经网络检测模型Bi ‑SINet; 在 Pytorch深度学习平台上运用SGD优化器优 化Bi‑ SINet模型; 在所构建的测试集上评估收敛的Bi ‑ SINet网络模型的检测性能。 本发明相比当前主 要的复杂背景下的目标检测算法SINet能取得更 好的检测性能。 本发明在降低了平均绝对误差的 同时, 实现了 更高的增强 ‑对齐指标、 结构指标及 加权的F指标, 是一种更加精确的复杂背景下的 目标检测算法。 权利要求书2页 说明书7页 附图4页 CN 114677571 A 2022.06.28 CN 114677571 A 1.一种基于双边注意力机制的复杂背景下的目标检测方法, 其特征在于, 该方法包括 如下步骤: 步骤S1: 根据公开的复杂背景 下的目标检测数据集, 构建训练集、 验证集和 测试集; 步骤S2: 构建基于双边注意力机制的Bi ‑SINet网络模型, 利用所构建的训练集对Bi ‑ SINet网络模型进行监 督训练, 直到模型收敛到最优性能; 步骤S3: 将收敛的Bi ‑SINet网络模型在所构建的测试集上进行测试, 根据检测结果评 估模型性能。 2.根据权利要求1所述一种基于双边注意力机制的复杂背景下的目标检测方法, 其特 征在于, 所述步骤S1中目标检测数据集包含数据集COD10K、 数据集CAMO和数据集 CHAMELEON。 3.根据权利要求1所述一种基于双边注意力机制的复杂背景下的目标检测方法, 其特 征在于, 所述 步骤S2具体包括: 步骤S201: 对训练数据进行预处理, 首先利用双线性插值法将原始图像大小调整为384 ×384, 并调整对应的真实标签, 随后进行图像数据增强处理, 最后将图像进行归一化处理 后输入Bi ‑SINet网络模型进行训练; 步骤S202: Bi ‑SINet网络模型对输入图像进行特征提取, 随后将提取到 的多层特征输 入渐进式的检测框架中进行检测; 渐进式的检测框架会基于每层特征进行前景目标分割, 共输出N个不同尺度的检测结果, 用 来表示, k =0, 1, ..., N‑1; 步骤S203: 在训练 阶段, 采用交叉熵损失函数和交并比损失函数对模型输出的N个检测 结果进行监 督训练, 总体损失函数 可以用Loverall来表示, 其计算公式为: 其中, 表示第k层检测结果与真实标签之间的结构加权后的交叉熵损失, 则表 示第k层检测结果与真实标签之间的结构加权后的交并比损失, 它 们的计算表达式分别为: 其中, H表示图像高度, W表示图像宽度, 和maskGT(x,y)分别表示第k层预测 结果和真实标签中位置坐标为(x,y)的值, γ是和结构权重相关的参数, w(x,y)表 示坐标为 (x,y)的位置对应的结构权 重, 其表达式如下:权 利 要 求 书 1/2 页 2 CN 114677571 A 2其中, Axy表示坐标为(x,y)的像素周围像素的集 合; 步骤S204: 在训练过程中, 采用随机梯度下降优化算法对网络参数进行迭代更新, 同时 以多项式法对学习率进行衰减; 训练过程中, 间隔若干次迭代使用所构建的验证集对模型 性能进行验证, 确保模型收敛到最优性能; 步骤S205: 利用优化收敛后固定参数的Bi ‑SINet网络模型对输入的待检测图像进行前 向计算, 即可获得 前景目标分割图作为检测结果。 4.根据权利要求1所述一种基于双边注意力机制的复杂背景下的目标检测方法, 其特 征在于, 所述 步骤S3具体包括: 步骤S301: 将待检测图片归一化后, 输入收敛的Bi ‑SINet网络模型进行检测, 在输出的 N个不同尺度的检测结果中, 选择尺度最大的 作为模型的最终检测结果maskpred; 步骤S302: 根据模型的检测结果maskpred和对应的真实标签maskGT, 计算平均绝对误差 MAE, 计算公式如下: 其中, H表示图像高度, W表示图像宽度, maskpred(x,y)和maskGT(x,y)分别表示预测结果 和真实标签中位置坐标为(x,y)的值; 步骤S303: 根据模型的检测结果maskpred和对应的真实标签maskGT, 计算客观评价指标 EM, 计算公式如下: 其中, H代 表图像高度, W表示图像宽度, φFM表示增强的对齐矩阵; 步骤S304: 根据模型的检测结果maskpred和对应的真实标签maskGT, 计算客观评价指标 SM, 计算公式如下: SM=α S0+(1‑α )Sr                             (7) 其中S0表示针对目标的结构相似度, Sr表示针对区域 的结构相似度, 平衡两者 的权重a 通常取值0.5; 步骤S305: 根据模型的检测结果maskpred和对应的真实标签maskGT, 计算客观评价指标 WFM, 计算公式如下: 其中Pw表示加权修正后的准确率, Rw表示加权修正后的召回率, β 是平衡准确率和召回 率的因子 。权 利 要 求 书 2/2 页 3 CN 114677571 A 3

.PDF文档 专利 一种基于双边注意力机制的复杂背景下目标检测方法

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于双边注意力机制的复杂背景下目标检测方法 第 1 页 专利 一种基于双边注意力机制的复杂背景下目标检测方法 第 2 页 专利 一种基于双边注意力机制的复杂背景下目标检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:32:46上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。