(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210448273.7
(22)申请日 2022.04.26
(71)申请人 广东电网有限责任公司广州供电局
地址 510620 广东省广州市天河区天河南
二路2号
(72)发明人 宋长青 汪创 曾耀强 吴彦伟
姚丙君
(74)专利代理 机构 杭州求是专利事务所有限公
司 33200
专利代理师 林超
(51)Int.Cl.
G06V 20/10(2022.01)
G06V 20/70(2022.01)
G06V 10/774(2022.01)
G06V 10/80(2022.01)G06V 10/82(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种基于双分支网络的施工人员图像计数
方法
(57)摘要
本发明公开了一种基于双分支网络的施工
人员图像计数方法。 采集基建场景现场人员图片
并添加标签; 以ResNet50网络部分以及双分支
Faster R‑CNN检测网络模型结合FPN特征金字塔
网络模型, 建立深度学习网络模型; 随机划分为
训练集和测试集; 训练集在对输入图片进行数据
增强后对深度学习网络模型进行训练, 然后采用
测试集测试调整, 针对待测图像输入固化后的人
员检测模型, 输出获得检测结果。 本发明能够实
现基建现场施工人员的自动计数, 具有较高的准
确率, 并且具有稳定性好, 抗干扰能力强, 通用性
高等有点, 具有良好的鲁棒性, 能够应用于基建
现场智能监管系统。
权利要求书1页 说明书4页 附图2页
CN 115240064 A
2022.10.25
CN 115240064 A
1.一种基于双分支网络的施工人员图像 计数方法, 其特 征在于方法包括以下步骤:
1)采集基建场景现场施工人员样本图片, 对每张图片用矩形包围框针对施工人员全局
框和施工人员可 见部分框进行 标记处理, 获得对应的样本标签文件;
2)以ResNet50网络部分、 双分支Faster R‑CNN检测网络模型结合FPN特征金字塔网络
模型, 建立深度学习网络模型;
3)将获得的所有基建场景现场人员样本 图片及其对应的基建场景现场人员样本标签
随机划分为训练集和 测试集;
4)对训练集进行 数据增强;
5)利用训练集对双分支Faster R‑CNN的深度学习网络模型进行训练, 获得初步训练后
的深度学习网络模型作为基建现场人员检测模型;
6)采用测试集测试初步训练后的基建现场人员检测的性能, 根据测试结果调整训练参
数与检测置信度阈值, 优化并固化基建现场人员检测模型;
7)针对待测图像输入固化后的基建现场人员检测模型, 输出获得检测结果。
2.根据权利要求1所述的一种基于双分支网络的施工人员图像计数方法, 其特征在于:
所述的基建场景现场人员样本图片是在各种基建场景下, 以基建作业现场的人员作为目标
物, 通过监管摄像头正对目标物的左右偏差15度和拍摄距离5 ‑25米范围内采集获得的图
片。
3.根据权利要求1所述的一种基于双分支网络的施工人员图像计数方法, 其特征在于:
所述步骤2)中, 深度学习网络模型具体是: 双分支Faster R‑CNN检测网络模型的骨干网络
使用ResNet50, 在双 分支Faster R‑CNN检测网络模型中的ResNet50网络部分和RPN网络部
分之间增设FPN特征金字塔网络模型, ResNet50网络部分输出不同阶段的特征再输入到FPN
特征金字塔网络模型中进程信息融合处 理输出融合后特 征图到RPN网络 部分
图片输入到ResNet50网络部分的输入层, 在ResNet50网络部分的第二特征提取阶段到
第五特征提取 阶段输出特征后, 均连接输入到FPN特征金字塔网络模型的输入, FPN特征金
字塔网络模型对ResNet50网络部分的第二特征提取 阶段到第五特征提取 阶段输出的不同
阶段特征进行插值融合并输出融合后特 征图。
4.根据权利要求1所述的一种基于双分支网络的施工人员图像计数方法, 其特征在于:
所述步骤2)中, 所述的双分支Faster R‑CNN检测网络模型是在Faster R‑CNN网络模型的
RPN网络部 分之后增设置两个检测头, 所述检测头是指RPN网络部 分之后的分类回归网络结
构, 两个检测头分别用于检测施工人员全局框和施工人员可 见部分框 。
5.根据权利要求4所述的一种基于双分支网络的施工人员图像计数方法, 其特征在于:
用于检测施工人员可 见部分框的检测头中, 建立以下正负 样本选择条件为:
IOU(P, F)>α and IOU(P, V)>β
式中, IOU为两个矩形交并比的计算方式, P,F,V分别为建议框、 施工人员全局框和施工
人员可见部分框, α表示建议框和施工人员全局框的交并比阈值, β 表示建议框和施工人员
全局框的交并比阈值; 若满足上述公式, 则建议框P为正样本, 代表建议框P中具有施工人
员; 若不满足上述公式, 则建议框P为负 样本, 代表建议框P中不具有施工人员。权 利 要 求 书 1/1 页
2
CN 115240064 A
2一种基于双分支网 络的施工人员 图像计数方 法
技术领域
[0001]本发明涉及了一种施工人员图像计数方法, 尤其是涉及了一种基于双分支 网络
的施工人员图像 计数方法。
背景技术
[0002]随着我国城市的规模化发展, 建设工地数量激增, 工地的施工人员也快速 增长。
然而, 简单的人工计数无法做到试试, 因此亟需研发自动化的施工人员 计数, 对施工现场
进行有效监管, 降低安全风险。
发明内容
[0003]为了解决背景技术中的问题, 本发明提出了一种基于双分支网络的施工人 员图
像计数方法, 能准确进行基建现场人员自动计数并具有良好稳定性。
[0004]本发明的技 术方案包括以下步骤:
[0005]1)采集基建场景现场施工人员样本图片, 对每张图片用矩形包围框针对施 工人
员全局框和施工人员可 见部分框进行 标记处理, 获得对应的样本标签文件;
[0006]所述样本标签文件符合Pascal VOC数据集的xml标签文件标准。
[0007]2)以ResNet50网络部分、 双分支Faster R‑CNN检测网络模型结合FPN特 征金字塔
网络模型, 建立深度学习网络模型;
[0008]3)将获得的所有基建场景现场人员样本图片及其对应的基建场景现场人员 样本
标签随机划分为训练集和 测试集;
[0009]4)对训练集进行 数据增强;
[0010]5)利用训练集对双分支Faster R‑CNN的深度学习网络模型进行训练, 获得 初步
训练后的深度学习网络模型作为基建现场人员检测模型;
[0011]6)采用测试集测试初步训练后的基建现场人员检测的性能, 根据测试结果 调整
训练参数与检测置信度阈值, 优化并固化基建现场人员检测模型;
[0012]7)针对待测图像输入固化后的基建现场人员检测模型, 输出获得检测结果, 根据
检测结果进行计数。
[0013]所述的基建场景现场人员样本图片是在各种基建场景下, 以基建作业现场 的人
员作为目标物, 通过监管摄像头正对目标物的左右偏差15度和拍摄距离 5‑25米范围内采
集获得的图片。
[0014]所述步骤2)中, 深度学习网络模型具体是: 双分支Faster R‑CNN检测网 络模型的
骨干网络使用ResNet50, 在双分支Faster R‑CNN检测网络模型中的 ResNet50网络部分和
RPN网络部分之间增设FPN特征金字塔网络模型, ResNet50网络部分输出不同阶段的特征
再输入到FPN特 征金字塔网络模型中进 程信息融合处 理输出融合后特 征图到RPN网络 部分
[0015]图片输入到ResNet50网络部分的输入层, 在ResNet50网络部分的第二特征 提取
阶段到第五特征提取阶段输出特征后, 均连接输入到FPN特征金字塔网络 模型的输入, FPN说 明 书 1/4 页
3
CN 115240064 A
3
专利 一种基于双分支网络的施工人员图像计数方法
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 07:32:40上传分享