说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210705194.X (22)申请日 2022.06.21 (71)申请人 国电南瑞科技股份有限公司 地址 211106 江苏省南京市江宁区诚信大 道19号 申请人 国电南瑞南京控制系统有限公司 (72)发明人 周立秋 唐元合 庞腊成 闪鑫  岑红星 邰曈 韩肖 邰淳亮  朱淞嵩 彭仲涛 成阳 许啸  史宁波  (74)专利代理 机构 南京苏高专利商标事务所 (普通合伙) 32204 专利代理师 柏尚春 (51)Int.Cl. G06F 16/2455(2019.01)G06F 16/2453(2019.01) G06F 16/22(2019.01) (54)发明名称 一种海量电网数据的实时查询方法、 系统及 存储介质 (57)摘要 本发明公开了一种海量电网数据的实时查 询方法、 系统及存储介质, 具体来说, 所述方法基 于电网图结构数据流的二级索引进行连续查询, 包括通用查询和k近邻查询, 二级索引包括自顶 向下的全局索引和本地索引, 在 进行电网图结构 数据相似度计算时采用状态复用计算的方法, 对 于时间窗口交叠部分的数据不作重复计算, 并且 将新进入的图和当前有效的图计算距离, 作为最 新的状态增量更新; 本发明的方法针对拥有动 态、 未知的电网轨迹流构建高更新能力的二级索 引以及基于索引的查询处理流程, 有效降低了图 相似度计算的时间复杂度及其状态表的维护代 价, 从而提升增量计算效率, 缩减查询时间, 同时 基于电网数据轨迹流实时更新索引结构, 进一步 提升了海量电网数据的监测和查询性能, 实现快 速、 实时的海量电网数据查询。 权利要求书1页 说明书6页 附图7页 CN 115098543 A 2022.09.23 CN 115098543 A 1.一种海量电网数据的实时查询方法, 其特 征在于, 包括如下步骤: (1)获取用户端发出的连续 查询需求和查询图Q; (2)加载全局索引和本地索引, 全局索引用于定位到与查询图Q相似的候选分区, 本地 索引用于在节点上搜索与查询图Q相似的候选图; (3)在全局索引和本地索引中进行过滤得到候选图, 对候选图进行相似度计算, 随机读 取当前时间窗口与历史时间窗口的交叠部分的图, 将新进入的图和当前有效的图计算距 离, 作为最新的状态增量更新, 同时删除不在时间窗口内的图及其状态; (4)聚合各本地节点的图相似度计算结果, 得到满足查询需求的结果 集合。 2.根据权利要求1所述的海量电网数据的实时查询方法, 其特征在于, 步骤(3)中使用 豪斯多夫距离计算图相似度, 图集T=<t1,t2,…,tm>和查询图Q=<q1,q2,…,qn>之间的距离 为: HAU(T,Q)=max{max  dis(ti,Q),max dis(qi,T)}, 保留HAU(T,Q)计算 过程中需要使用到 的两点之间距离 。 3.根据权利要求1所述的海量电网数据的实时查询方法, 其特征在于, 步骤(1)中所述 查询需求为k近邻查询, 步骤(4)中, 在 对候选图进 行相似度计算后, 构建小顶 堆, 返回前k个 结果, 全局节点收到各本地节点返回的结果, 执行归并排序, 得到k个满足查询需求的结果 图。 4.根据权利要求1所述的海量电网数据的实时查询方法, 其特征在于, 步骤(2)中的所 述全局索引用自顶向下的结构将电网数据进行分区。 5.根据权利要求4所述的海量电网数据的实时查询方法, 其特征在于, 所述分区方法 为: 将电网数据流数据映射为二 维网格空间, 用矩形中心 点的横坐标进 行排序, 再用垂 直切 片切割二维网格空间, 然后用矩形中心点的纵坐标进行排序, 若干个矩形组成一个叶节点。 6.根据权利要求1所述的海量电网数据的实时查询方法, 其特征在于, 所述本地索引建 立在所述全局索引的每 个叶子结点中, 所述本地索引为R ‑树索引。 7.根据权利要求1所述的海量电网数据的实时查询方法, 其特征在于, 步骤(2)中的所 述全局索引和本地索引 在实时电网数据流入过程中, 基于滑动时间窗口进行更新, 对不能 进行复用的电网数据重新构建索引。 8.一种海量电网数据的实时查询系统, 其特征在于, 包括协调者节点和若干作业节点, 所述协调者节点中的采样 器用于将当前的电网数据轨迹 分布映射为二维网格空间, 并实时 监测电网数据分布的变化, 所述采样器将映射后的数据发送至分发器建立全局索引, 将数 据分区, 并基于分区分发数据至相 应的作业节点; 每个所述作业节点均包含本地索引和作 业执行器, 所述作业执 行器用于在查询过程中执 行数据过滤和精化 流程。 9.根据权利要求8所述的海量电网数据的实时查询系统, 所述作业执行器中的精化流 程包括图相似度计算, 所述图相似度计算的方法为: 随机读取当前时间窗口与历史时间窗 口的交叠部分的 已计算状态, 将新进入的图和当前有效的图计算距离, 作为最新的状态增 量更新, 同时删除不在时间窗口内的图及其状态。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现如权利要求1~7任一项所述的查询方法。权 利 要 求 书 1/1 页 2 CN 115098543 A 2一种海量电网数据的实时查询方 法、 系统及存 储介质 技术领域 [0001]本发明涉及一种电网数据的查询方法、 系统及存 储介质。 背景技术 [0002]在电网系统中, 变电集控起着至关重要的作用, 因为它不仅驱动输配电工作, 而且 还负责电气设备的组装、 电压的调整和重要任务的联系, 大量的电力数据是实时产生的, 需 要不断地进 行处理。 例如, 用户可以通过对历史和当前信息的实时分析, 对电力集控做出快 速的决策或预测。 在实时处理系统中, 每个输入图元都扮演着检索和更新的角色。 具体来 说, 对于这样一个系统, 所有现有的树形索引(如R ‑tree)只能满足查询效率的要求, 但在更 新效率方面表现不佳。 [0003]大数据平台(如Flink、 Spark)提供了一套比较便捷管理、 开发数据的能力, 虽然基 于这些平台可以快速的根据目标需求定制相应服务, 但是这种简单粗暴的方式往往是高开 销、 低性能的, 是一种得不偿失的行为。 电网系统中的电力数据监测本质是实时处理大量的 图数据, 而图数据中的相似度往往隐含着重要含义, 为了去解决这种图相似性问题, 有很多 对于图相似度计算的方法, 主 要分集中 式和分布式方法, 在下面两段做简述。 [0004]集中式的图相似度做 法往往是定义不同的距离衡量方法, 在数学的角度对不同的 距离度量适应性作证明。 例如, 人和人之间的距离往往在日常中是以 “欧氏距离 ”来默认替 代的, 但是在实际工业应用时, 可能也会有 “曼哈顿距离 ”、“编辑距离 ”等等。 [0005]分布式的图相似度做法往往是以Hadoop之上的大数据平台来建设的, 整个处理图 相似度的系统以主从分布式集群来处理。 主节点主要完成协调的工作, 使得不同的从节点 都执行局部计算的任务。 但是这种简单的MapReduce架构可能仍有一定的局限性: (1)无法 自适应地应对实时电网数据流的即时更新; (2)无法感知时空上的负载倾斜; (3)查询的性 能不适配实时分布式流处 理环境(受限于频繁更新代价)。 [0006]《Distributed  trajectory  similarity  search》 (D.Xie,F.Li,and   J.Phillips.Distributed  trajectory  similarity  search.PVLDB,10:1478 –1489,2017.) 公开了一个分布式空间数据计算框架DFT, 面向轨迹数据的分布式大规模计算, 但筛选过程 是利用分布式空间索引实现的。 这就要求全局索引和局部索引的每个节点都要用咆哮位图 (Roaring  Bitmap)来记录经过节点的轨迹ID集合, 这导致DFT 中的分布式空间索引体积非 常庞大, DFT需要知道轨 迹集中所有的轨 迹ID。 [0007]名称为“一种分布式环境下基于社会感知的空间索引方法 ”, 公开号为 CN109190052A的专利公开了一种基于R树的空间索引方法, 支持分布式环 境下的查询, 但该 索引对于静态数据建立的, 索引的更新和存储开销较大, 无法实现针对电网数据流的实时 查询, 即索引更新 开销远大于查询流 程开销。 发明内容 [0008]发明目的: 本发明的第一目的是提供一种对电网数据轨迹流的索引结构实时更新说 明 书 1/6 页 3 CN 115098543 A 3

.PDF文档 专利 一种海量电网数据的实时查询方法、系统及存储介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种海量电网数据的实时查询方法、系统及存储介质 第 1 页 专利 一种海量电网数据的实时查询方法、系统及存储介质 第 2 页 专利 一种海量电网数据的实时查询方法、系统及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 00:11:48上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。