说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210691498.5 (22)申请日 2022.06.17 (71)申请人 上海驻云信息科技有限公司 地址 201203 上海市浦东 新区中国(上海) 自由贸易试验区科 苑路399号7幢 (72)发明人 蒋烁淼 陆宏鸣 (74)专利代理 机构 北京中索 知识产权代理有限 公司 11640 专利代理师 隋晓勇 (51)Int.Cl. G06F 16/2455(2019.01) G06F 16/2458(2019.01) (54)发明名称 一种流式大 数据分频预聚合与查询方法 (57)摘要 本发明提供一种流式大数据分频预聚合与 查询方法及系统, 所述方法包括以下步骤: 将指 标数据进行分组, 将分组的指标数据以及相同链 路服务之间的调用关系数据进行分钟级别的预 聚合统计; 启动小时级别定时任务, 将分钟级别 数据聚合 成小时级的预聚合统计数据; 启动日级 别的定时任务, 将小时级数据再聚合成日级的预 聚合统计数据; 切分数据查询的时间范围; 通过 查询器从不同层级的分频预聚合数据中统计对 应的时间范围的数据; 在内存中汇总聚合计算, 得出计算结果返回调用方。 本发 明利用少量的存 储资源达到降低计算资源消耗 以及缩短用户的 数据查询时间, 并且能够根据用户查询的时间范 围自动从不同层级的预聚合频段的预聚合数据 中查询统计 。 权利要求书2页 说明书6页 附图2页 CN 115098542 A 2022.09.23 CN 115098542 A 1.一种流式大 数据分频 预聚合与查询方法, 其特 征在于, 包括以下步骤: a1、 在原始数据流入数据中心写入存储引擎之前, 以数据链路服务的服务名称将指标 数据进行分组, 将分组的指标数据以及相同链路服务之 间的调用关系数据进 行分钟级别的 预聚合统计; a2、 启动一个小时级别的定时任务, 将前一个整小时内的所述分钟级别的预聚合数据 再进行一级聚合, 聚合成分组的小时级的预聚合统计数据; a3、 启动一个日级别的定时任务, 将前一整日的小时级预聚合数据再进行一级聚合, 聚 合成分组的日级的预聚合统计数据; a4、 将数据查询的时间范围从小时级别切分成: 一个小时级别和多个分钟级别的组合、 多个小时级别和多个分钟级别的组合、 多个小时级别和一个分钟级别的组合、 多个小时级 别、 多个分钟级别的五种方式 中的一种; a5、 通过查询器从所述分钟级预聚合数据中统计分钟级时间范围的数据, 从小时级预 聚合数据中统计小时级时间范围的数据, 以此类推, 从不同层级的分频预聚合数据中统计 对应的时间范围的数据; a6、 将所述从不同层级的分频预聚合数据中查询出来的数据链路服务以及指标数据在 内存中汇总聚合计算, 得 出计算结果。 2.根据权利要求1所述的流式大数据分频预聚合与查询方法, 其特征在于, 所述a1步骤 的所述服务名称包括: 请求数、 错 误数、 平均响应时间。 3.根据权利要求1所述的流式大数据分频预聚合与查询方法, 其特征在于, 所述a1步骤 的所述预聚合统计之后还 包括: 将所述预聚合统计的预聚合数据单独一份存储; 将原始数据存储进存储引擎, 再单独 在存储引擎中存 储一份所述预聚合数据。 4.根据权利要求1所述的流式大数据分频预聚合与查询方法, 其特征在于, 所述a5步骤 的所述从不同层级的分频 预聚合数据中统计对应的时间范围的数据的方法包括: 如查询的时间范围超过一天, 则时间范围将自动切分成分钟、 整小时、 整天三个时间范 围层级的数据查询范围。 5.根据权利要求1所述的流式大数据分频预聚合与查询方法, 其特征在于, 所述a5步骤 的所述从不同层级的分频 预聚合数据中统计对应的时间范围的数据的方法还 包括: 如查询一个月时间范围的的数据, 则对第 一层的分钟级别的预聚合数据 再进行一层或 N层的更大时间范围的预聚合。 6.根据权利要求1所述的流式大数据分频预聚合与查询方法, 其特征在于, 所述a6步骤 之后还包括: 将所述计算结果返回给调用方。 7.一种流式大数据分频预聚合与查询系统, 执行如权利要求1 ‑6任一项所述的流式大 数据分频 预聚合与查询方法, 其特 征在于, 包括: 预聚合统计模块: 用于在原始数据流入数据中心写入存储引擎之前, 以数据链路服务 的服务名称将指标数据进 行分组, 将分组的指标数据以及相同链路服务之 间的调用关系数 据进行分钟级别的预聚合统计; 小时级聚合模块: 用于启动一个小时级别的定时任务, 将前一个整小时内的所述分钟 级别的预聚合数据再进行一级聚合, 聚合成小时级的预聚合统计数据;权 利 要 求 书 1/2 页 2 CN 115098542 A 2日级聚合模块: 用于启动一个日级别的定时任务, 将前一整日的小时级预聚合数据再 进行一级聚合, 聚合成分组的日级的预聚合统计数据; 查询范围切分模块: 用于将数据查询的时间范围从小时级别切分成: 一个小时级别和 多个分钟级别的组合、 多个小时级别和多个分钟级别的组合、 多个小时级别和一个分钟级 别的组合、 多个小时级别、 多个分钟级别的五种方式 中的一种; 统计查询数据模块: 通过查询器从所述分钟级预聚合数据中统计分钟级时间范围的数 据, 从小时级 预聚合数据中统计小时级时间范围的数据, 以此类推, 从不同层级的分频预聚 合数据中统计对应的时间范围的数据; 汇总聚合模块: 用于将从不同层级的分频预聚合数据中查询出来的数据链路服务以及 指标数据在内存中汇总聚合计算, 得 出计算结果, 将所述计算结果返回给调用方。 8.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述程序被处理器 执行时实现权利要求1 ‑6任一项所述的流式大 数据分频 预聚合与查询方法的步骤。 9.一种计算机设备, 所述计算机设备包括存储器、 处理器及存储在存储器上并可在处 理器上运行的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求 1‑6任 一项所述的流式大 数据分频 预聚合与查询方法的步骤。权 利 要 求 书 2/2 页 3 CN 115098542 A 3
专利 一种流式大数据分频预聚合与查询方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 00:11:44
上传分享
举报
下载
原文档
(698.2 KB)
分享
友情链接
GB/Z 24294.2-2017 信息安全技术 基于互联网电子政务信息安全实施指南 第2部分:接入控制与安全交换.pdf
GB-T 20269-2006 信息安全技术 信息系统安全管理要求.pdf
HJ 164-2020 地下水环境监测技术规范.pdf
GB-T 28420-2012 电子收费 OBE-SAM数据格式和技术要求.pdf
T-ZZB 0602—2018 环保节能舒适型冷风扇.pdf
DB63-T 1408-2015 甜椒设施育苗技术规范 青海省.pdf
医疗卫生机构网络安全管理办法.pdf
DB46-T 154-2009 电梯节能改造技术指南 海南省.pdf
ISO 19160-4 2023 Addressing — Part 4 International postal address components and template.pdf
GB-T 21063.2-2007 政务信息资源目录体系 第2部分 技术要求.pdf
NIST 零信任架构 中文版.pdf
信息安全能力建设5级矩阵 英文版.pdf
DB5104-T 54.1-2022 节能改造技术规范 第1部分:水泵系统 攀枝花市.pdf
GB-T 35522-2017 化学品 土壤弹尾目昆虫生殖试验.pdf
GB-T 37165-2018 机器人用精密摆线针轮减速器.pdf
GB-T 41560-2022 纺织品 遮热性能的测定.pdf
GA-T 1781-2021 公共安全社会视频资源安全联网设备技术要求.pdf
GB-T 42467.9-2023 中医临床名词术语 第9部分:耳鼻喉科学.pdf
GB-T 15114-2023 铝合金压铸件.pdf
DB50-T 1275.5-2022 生猪智慧养殖数字化应用与管理 第5部分:生产管理 重庆市.pdf
1
/
3
11
评价文档
赞助2.5元 点击下载(698.2 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。