说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210388526.6 (22)申请日 2022.04.14 (71)申请人 重庆亲禾智千科技有限公司 地址 401120 重庆市渝北区仙桃街道数据 谷东路19号 (72)发明人 袁杨宇 刘宽 樊宸铭 王鹏 (74)专利代理 机构 北京中政联科专利代理事务 所(普通合伙) 11489 专利代理师 覃毅 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/82(2022.01) G06V 10/80(2022.01) H04N 7/18(2006.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种基于deepstream的图书识别方法 (57)摘要 本发明公开了一种基于deepstream的图书 识别方法, 属于图书分拣技术领域, 所述识别方 法通过以流媒体相机为输入源, 获取外部图像, 将视频信号以rtsp流的形式传输, 在视频 实时传 输到微型计算机后, 使用基于gstream的 deepstream技术对rtsp流进行实时处理, 通过建 立管道对视频信号完成解析, 再通过在管道上建 立的插件, 完成对图书的识别。 采用本发明方法 对图书进行识别, 可以弥补现有技术中对于图书 识别的场景以及投入 段的重叠, 并且减少对硬件 的要求。 权利要求书1页 说明书2页 附图1页 CN 114898247 A 2022.08.12 CN 114898247 A 1.一种基于deepstream的图书识别方法, 其特征在于: 所述识别方法通过以流媒体相 机为输入源, 获取图书的外部图像, 将 视频信号以rtsp流的形式传输, 在视频实时传输到微 型计算机后, 采用Yolo v4算法, 使用基于gstream的deepstream技术对rtsp流进行实时处 理, 通过建立管道对视频信号完成解析, 再通过在管道上建立的插件, 完成对图书的识别, 所述deepstream的视频处理技术通过接入多路视频实时处理, 完成多摄像头对一机器的处 理。 , Yolo v4在基准网络和输出层之间添加了SPP 模块与FPN +PAN两种方式, SPP 模块通过融 合不同大小的最大池化层来获得鲁棒的特征表 示, 最大池化层 采用padding操作, 移动步长 为1。 2.根据权利要求1所述的基于deepstream的图书识别方法, 其特征在于: Yolo v4的 neck结构采用FPN+PAN模式, FPN是自顶向下的, 将高层特征通过上采样和低层特征做融合 得到进行 预测的特 征图, 两部分通过 FPN+PAN结构进行融合。权 利 要 求 书 1/1 页 2 CN 114898247 A 2一种基于de epstream的图书识别方 法 技术领域 [0001]本发明属于图书分拣技 术领域, 具体涉及一种基于de epstream的图书识别方法。 背景技术 [0002]目前在图书馆分拣过程中主要分为投入段、 输送段、 识别段、 分拣段等几大部分, 但是由于使用对象特殊 性, 图书分拣系统与其 他分拣系统有着明显的差异。 比如: [0003]1、 从投入段来看, 图书分拣系统要求进入分拣系统的图书不可以重叠, 若是图书 重叠之, 识别系统所看到的图书外观 就发生了很大的变化, 在后续的识别过程中、 分拣过程 中就会大幅地 提升错误率。 [0004]2、 输送段需要根据图书馆场地不 同, 通过为多样的组合形式, 最终将图书运送至 分拣机进行分拣, 并且每本图书所放的间距都有 要求, 故而增 加了人力物力。 [0005]3、 在硬件方面, 增加多条主线汇聚后再进入最终的分拣部分, 使得最终图书量非 常大, 对硬件的要求非常高, 对识别的精度要求 也随之提高。 发明内容 [0006]有鉴于此, 本发明的目的在于提供一种基于deepstream的图书识别方法, 可以弥 补现有技 术中对于图书识别的场景以及投入段的重 叠, 并且减少对硬件的要求。 [0007]为达到上述目的, 本发明提供如下技 术方案: [0008]本发明一种基于deepstr eam的图书识别方法, 所述识别方法通过以流媒体相机为 输入源, 获取外部图像, 将视频信号 以rtsp流的形式传输, 在视频实时传输到微型计算机 后, 使用基于gstream的deepstream技术对rtsp流进行实时处理, 通过建立管道对视频信号 完成解析, 再通过在管道上建立的插 件, 完成对图书的识别。 [0009]进一步, 所述deepstream的视频处理技术通过接入多路视频实时处理, 完成多摄 像头对一机器的处 理。 [0010]进一步, Yolo v4在基准网络和输出层之间添加了SPP模块与FPN+PAN两种方式, SPP模块通过融合不同大小的最大池化层来获得鲁棒的特征表 示, 最大池化层 采用padding 操作, 移动步长为1。 [0011]进一步, Yolo v4的neck结构采用FPN+PAN模式, FPN是自顶向下的, 将高层特征通 过上采样和低层特 征做融合得到进行 预测的特 征图, 两部分通过 FPN+PAN结构进行融合。 [0012]本发明的有益效果在于: [0013]本发明一种基于deepstream的图书识别方法, 通过采用机器视觉技术, 可以模拟 人的视觉功能, 从客观的事物中提取特征信息, 可有效的判断各个阶段中的图书是否出现 重叠, 以及传输篮中的图书是否清空, 可以弥补现有技术中对于图书识别的场景以及投入 段的重叠, 并且减少对硬件的要求。 [0014]本发明的其他优点、 目标和特征将在随后的说明书中进行阐述, 并且在某种程度 上对本领域技术人员而言是显而易见的, 或者本领域技术人员可以从本发明的实践中得到说 明 书 1/2 页 3 CN 114898247 A 3
专利 一种基于deepstream的图书识别方法
文档预览
中文文档
5 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共5页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 07:32:12
上传分享
举报
下载
原文档
(310.0 KB)
分享
友情链接
T-GCHA 1.5—2018 定制家居产品 人造板定制衣柜 第5部分:客户服务规范.pdf
GB-T 43328-2023 浮空器术语.pdf
GB-T 36478.2-2018 物联网 信息交换和共享 第2部分:通用技术要求.pdf
JR-T0213-2021 金融网络安全 Web 应用服务安全测试通用 规范.pdf
T-TJKCSJ 001—2020 天津市全过程工程咨询服务导则.pdf
DB32-T 3514.8-2019 电子政务外网建设规范 第8部分:运维服务 江苏省.pdf
DB65-T4613-2022 农村卫生户厕建设与管理规范 新疆维吾尔自治区.pdf
工业控制系统信息安全防护指南 解读.pdf
JYT 0631-2020 义务教育学校音乐教室建设与装备规范.pdf
DB11-T 1208-2020 固定资产投资项目节能监察技术核查报告编制规范 北京市.pdf
DB3306-T 045-2022 公共图书馆数字媒体服务规范 绍兴市.pdf
SY-T 7657.3-2021 天然气 利用光声光谱-红外光谱-燃料电池联合法测定组成 第3部分:红外光谱法测定乙烷及以上烷烃、二氧化碳、一氧化碳含量.pdf
GB-T 33356-2022 新型智慧城市评价指标.pdf
GB-T 43290-2023 电子商务逆向物流通用服务规范.pdf
AQ-T 3046-2013 化工企业定量风险评价导则.pdf
ISO SAE 21434 Road vehicles— Cybersecurity engineering.pdf
信通院 联邦学习应用安全研究报告 2023年.pdf
GB-T 29157-2012 浮法玻璃生产生命周期评价技术规范 产品种类规则.pdf
思度安全-DSMM-001 数据安全管理总纲V1.0.pdf
GB-T 42961-2023 植被生态质量的气候变化影响评价方法.pdf
1
/
3
5
评价文档
赞助2.5元 点击下载(310.0 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。