(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210397321.4
(22)申请日 2022.04.15
(71)申请人 广州天长信息技 术有限公司
地址 510000 广东省广州市黄埔区敏盛街6
号303房
(72)发明人 谭林睿 李咏梅 林荣斌
(74)专利代理 机构 广州文智专利代理事务所
(特殊普通 合伙) 44469
专利代理师 刘敏
(51)Int.Cl.
G06F 16/2455(2019.01)
G06F 16/22(2019.01)
G06F 16/248(2019.01)
G06K 9/62(2022.01)
G08G 1/017(2006.01)
(54)发明名称
一种检测行程车牌识别错误的计算方法和
系统
(57)摘要
本发明公开了一种检测行程车牌识别错误
的计算方法和系统, 该方法包括以下步骤: S1、 获
取入口信息、 出口信息、 门架流水信息和车牌识
别信息; S2、 进行编辑距离算法匹配; S3、 对中间
表进行分类; S4、 对门架信息和牌识信息进行匹
配; S5、 人为分析异常数据; S6、 将所得的结果与
nosql缓存数据库中的信息 车牌对应识别车牌进
行匹配。 本发明在设备误识别、 设备故障、 故意换
牌等多方面可能对车辆车牌造成影 响的情况下,
利用大数据结合技术手段来获取车辆真实路径。
对于车辆套牌, 本发明也可 以快速定位车辆, 以
及通过数据库中信息快速产出结果报告, 获取车
辆历史车牌识别情况, 快速定位车辆问题行程,
辅助证据链查证, 打击犯罪。
权利要求书1页 说明书4页 附图2页
CN 114780591 A
2022.07.22
CN 114780591 A
1.一种检测行程车牌识别错 误的计算方法, 其特 征在于, 包括以下步骤:
S1、 获取入口信息、 出口信息、 门架流水信息和车牌识别信息, 然后将获得的信息数据
处理后生成中间表;
S2、 将中间表中入口车牌、 出口车牌、 入口识别车牌、 出口识别车牌进行编辑距离算法
匹配, 通过S PARK程序将数据筛 选保存到n osql缓存数据库中;
S3、 对中间表进行分类, 筛选出异常数据, 该异常数据包括有出入口信息无牌识信息、
有入口信息无 出口信息无牌识信息、 无关联牌识信息、 无入口信息有出口信息无牌识信息;
S4、 对有出入口信息无牌识信息、 有入口信息无出口信息无牌识信息分别获取其门架
信息, 并和对应时间段牌识信息进行匹配, 然后对交易时间戳数据进 行归一化, 完成后进 行
门架和牌识数据差异匹配, 每笔计算偏差值, 并得到门架信息每一笔是否匹配; 根据匹配笔
数、 行程应有门架数、 行程门架覆盖率获取偏差值, 门架与牌识匹配取偏差值最小的那个;
若最小的偏差值接 近1, 则执 行步骤S5, 若否, 则执 行步骤S6;
S5、 人为分析异常数据, 筛查和排除数据问题后执 行步骤S1 ‑S4;
S6、 将所得的结果与 nosql缓存数据库中的信息车牌对应识别车牌进行匹配, 若车牌出
现在库中则直接取库中结果; 若车牌 不在库中则取步骤S4中取 得的偏差值 最小车牌。
2.根据权利要求1所述的检测行程车牌识别错误的计算方法, 其特征在于, 还包括以下
步骤:
S7、 根据真实车牌、 真实车牌出口信息完善整个行程, 并对疑似出口出行方式、 真实车
牌做好标记。
3.根据权利要求1所述的检测行程车牌识别错误的计算方法, 其特征在于, 还包括以下
步骤:
S8、 如步骤S6车牌不在相似库中, 则将信息同步更新到nosql数据库中执行笔数加1, 如
不在库中, 则将步骤S7中真实车牌与入口识别车牌 继续编辑距离算法, 相似则进入相似库,
不相似则进入非相似库。
4.根据权利要求1所述的检测行程车牌识别错误的计算方法, 其特征在于, 步骤S4中对
数据时间戳进 行归一化具体为将交易时间数据按四舍五入方法将秒小于30 s的归到退到当
前分钟的0s, 大于 30s的归到下一分钟的0s。
5.根据权利要求1所述的检测行程车牌识别错误的计算方法, 其特征在于, 步骤S2中将
车牌之间matrix<3, similar>0.66的保存为相似车牌; 将其他的保存为非相似 车牌, 对非相
似车牌保存其出现次数。
6.一种如权利 要求1‑5所述的检测行程车牌识别错误系统, 其特征在于, 包括ETL应用、
nosql缓存数据库、 交易时间戳数据归一化模块、 门架牌识匹配偏差计算模块、 相 似车牌计
算模块, 所述ETL应用用于采集出口信息、 入口信息、 门架流水信息和车牌识别信息; 所述
nosql缓存数据库用于存储信息; 交易时间戳数据归一化模块通过可视化在线编译
sparksql对交易时间戳数据进 行归一化计算和数据标准化; 所述门架 牌识匹配偏 差计算模
块以在线编译热部署至SPARK, 用于计算门架和牌识数据的每笔偏差值, 并得到门架信息每
一笔是否匹配, 根据匹配笔数、 行程应有门架数、 行程门架覆盖率获取偏差值, 门架与牌识
匹配取偏差值 最小的那个; 所述相似车牌计算模块 通过编辑距离算法测算相似识别车牌。权 利 要 求 书 1/1 页
2
CN 114780591 A
2一种检测行程车牌 识别错误 的计算方 法和系统
技术领域
[0001]本发明属于, 具体涉及一种检测行程车牌识别错 误的计算方法和系统。
背景技术
[0002]在高速公路实行全国联网后, 高速公路大数据时代开始, 数据也开始变得越来越
繁杂, 从不同省份不同路段的收费系统、 车辆车牌识别设备来说就有很多, 导致数据虽然
多, 但是数据准确有 所欠缺。 特别是对于异常识别的行程, 难以与实际对应的行程路径进 行
绑定, 导致出口信息无法与实际车辆匹配, 无法还原车辆的真实路径情况。 从而 出现在收费
站出口时最小 费额缴费、 缴费实际车型不符等各种情况, 对实际各个路段公司造成经济损
失, 以及增加了 收费站运营成本, 稽核部门查证成本。 当前现有都是需要时通过人工筛查,
成本较高。
[0003]因此, 一种检测行程车牌识别错 误的计算方法和系统亟 待提出。
发明内容
[0004]为解决现有技术存在的缺陷, 本发明提供一种检测行程车牌识别错误的计算方法
和系统。 通过结合系统测算行程的真实车牌, 用于佐证确认识别错误的行程错误车牌, 降低
收费站收费错 误可能性, 降低后续异常车辆链路查询成本
[0005]为了解决上述 技术问题, 本发明提供了如下的技 术方案:
[0006]本发明提供一种检测行程车牌识别错 误的计算方法, 包括以下步骤:
[0007]S1、 获取入口信息、 出口信息、 门架流水信息和 车牌识别信息, 然后将获得的信息
数据处理后生成中间表;
[0008]S2、 将中间表中入口车牌、 出口车牌、 入口识别车牌、 出口识别车牌进行编辑距离
算法匹配, 通过S PARK程序将数据筛 选保存到n osql缓存数据库中;
[0009]S3、 对中间表进行分类, 筛选出异常数据, 该异常数据包括有出入口信息无牌识信
息、 有入口信息无出口信息无牌识信息、 无关联牌识信息、 无入口信息有 出口信息无牌识信
息;
[0010]S4、 对有出入口信息无牌识信息、 有入口信息无出口信息无牌识信息分别获取其
门架信息, 并和对应时间段牌识信息进 行匹配, 先对交易时间戳数据进 行归一化, 完成后进
行门架和牌识数据差异匹配, 每笔计算偏差值, 并得到门架信息每一笔是否匹配; 根据匹配
笔数、 行程应有门架数、 行程门架覆盖率获取偏差值, 门架与牌识匹配取偏差值最小的那
个; 若最小的偏差值接 近1, 则执 行步骤S5, 若否, 则执 行步骤S6;
[0011]S5、 人为分析异常数据, 筛查和排除数据问题后执 行步骤S1 ‑S4;
[0012]S6、 将所得的结果与nosql缓存数据库中的信息车牌对应识别车牌进行匹配, 若车
牌出现在库中则直接取库中结果; 若车牌 不在库中则取步骤S4中取 得的偏差值 最小车牌。
[0013]作为本发明的一种优选技 术方案, 还 包括以下步骤:
[0014]S7、 根据真实车牌、 真实车牌出口信息完善整个行程, 并对疑似出口出行方式、 真说 明 书 1/4 页
3
CN 114780591 A
3
专利 一种检测行程车牌识别错误的计算方法和系统
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 00:11:42上传分享