说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210388526.6 (22)申请日 2022.04.14 (71)申请人 重庆亲禾智千科技有限公司 地址 401120 重庆市渝北区仙桃街道数据 谷东路19号 (72)发明人 袁杨宇 刘宽 樊宸铭 王鹏  (74)专利代理 机构 北京中政联科专利代理事务 所(普通合伙) 11489 专利代理师 覃毅 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/82(2022.01) G06V 10/80(2022.01) H04N 7/18(2006.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种基于deepstream的图书识别方法 (57)摘要 本发明公开了一种基于deepstream的图书 识别方法, 属于图书分拣技术领域, 所述识别方 法通过以流媒体相机为输入源, 获取外部图像, 将视频信号以rtsp流的形式传输, 在视频 实时传 输到微型计算机后, 使用基于gstream的 deepstream技术对rtsp流进行实时处理, 通过建 立管道对视频信号完成解析, 再通过在管道上建 立的插件, 完成对图书的识别。 采用本发明方法 对图书进行识别, 可以弥补现有技术中对于图书 识别的场景以及投入 段的重叠, 并且减少对硬件 的要求。 权利要求书1页 说明书2页 附图1页 CN 114898247 A 2022.08.12 CN 114898247 A 1.一种基于deepstream的图书识别方法, 其特征在于: 所述识别方法通过以流媒体相 机为输入源, 获取图书的外部图像, 将 视频信号以rtsp流的形式传输, 在视频实时传输到微 型计算机后, 采用Yolo  v4算法, 使用基于gstream的deepstream技术对rtsp流进行实时处 理, 通过建立管道对视频信号完成解析, 再通过在管道上建立的插件, 完成对图书的识别, 所述deepstream的视频处理技术通过接入多路视频实时处理, 完成多摄像头对一机器的处 理。 , Yolo  v4在基准网络和输出层之间添加了SPP 模块与FPN +PAN两种方式, SPP 模块通过融 合不同大小的最大池化层来获得鲁棒的特征表 示, 最大池化层 采用padding操作, 移动步长 为1。 2.根据权利要求1所述的基于deepstream的图书识别方法, 其特征在于: Yolo  v4的 neck结构采用FPN+PAN模式, FPN是自顶向下的, 将高层特征通过上采样和低层特征做融合 得到进行 预测的特 征图, 两部分通过 FPN+PAN结构进行融合。权 利 要 求 书 1/1 页 2 CN 114898247 A 2一种基于de epstream的图书识别方 法 技术领域 [0001]本发明属于图书分拣技 术领域, 具体涉及一种基于de epstream的图书识别方法。 背景技术 [0002]目前在图书馆分拣过程中主要分为投入段、 输送段、 识别段、 分拣段等几大部分, 但是由于使用对象特殊 性, 图书分拣系统与其 他分拣系统有着明显的差异。 比如: [0003]1、 从投入段来看, 图书分拣系统要求进入分拣系统的图书不可以重叠, 若是图书 重叠之, 识别系统所看到的图书外观 就发生了很大的变化, 在后续的识别过程中、 分拣过程 中就会大幅地 提升错误率。 [0004]2、 输送段需要根据图书馆场地不 同, 通过为多样的组合形式, 最终将图书运送至 分拣机进行分拣, 并且每本图书所放的间距都有 要求, 故而增 加了人力物力。 [0005]3、 在硬件方面, 增加多条主线汇聚后再进入最终的分拣部分, 使得最终图书量非 常大, 对硬件的要求非常高, 对识别的精度要求 也随之提高。 发明内容 [0006]有鉴于此, 本发明的目的在于提供一种基于deepstream的图书识别方法, 可以弥 补现有技 术中对于图书识别的场景以及投入段的重 叠, 并且减少对硬件的要求。 [0007]为达到上述目的, 本发明提供如下技 术方案: [0008]本发明一种基于deepstr eam的图书识别方法, 所述识别方法通过以流媒体相机为 输入源, 获取外部图像, 将视频信号 以rtsp流的形式传输, 在视频实时传输到微型计算机 后, 使用基于gstream的deepstream技术对rtsp流进行实时处理, 通过建立管道对视频信号 完成解析, 再通过在管道上建立的插 件, 完成对图书的识别。 [0009]进一步, 所述deepstream的视频处理技术通过接入多路视频实时处理, 完成多摄 像头对一机器的处 理。 [0010]进一步, Yolo  v4在基准网络和输出层之间添加了SPP模块与FPN+PAN两种方式, SPP模块通过融合不同大小的最大池化层来获得鲁棒的特征表 示, 最大池化层 采用padding 操作, 移动步长为1。 [0011]进一步, Yolo  v4的neck结构采用FPN+PAN模式, FPN是自顶向下的, 将高层特征通 过上采样和低层特 征做融合得到进行 预测的特 征图, 两部分通过 FPN+PAN结构进行融合。 [0012]本发明的有益效果在于: [0013]本发明一种基于deepstream的图书识别方法, 通过采用机器视觉技术, 可以模拟 人的视觉功能, 从客观的事物中提取特征信息, 可有效的判断各个阶段中的图书是否出现 重叠, 以及传输篮中的图书是否清空, 可以弥补现有技术中对于图书识别的场景以及投入 段的重叠, 并且减少对硬件的要求。 [0014]本发明的其他优点、 目标和特征将在随后的说明书中进行阐述, 并且在某种程度 上对本领域技术人员而言是显而易见的, 或者本领域技术人员可以从本发明的实践中得到说 明 书 1/2 页 3 CN 114898247 A 3

.PDF文档 专利 一种基于deepstream的图书识别方法

文档预览
中文文档 5 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共5页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于deepstream的图书识别方法 第 1 页 专利 一种基于deepstream的图书识别方法 第 2 页 专利 一种基于deepstream的图书识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:32:12上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。