说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202211118065.7 (22)申请日 2022.09.15 (65)同一申请的已公布的文献号 申请公布号 CN 115204754 A (43)申请公布日 2022.10.18 (73)专利权人 山东西曼克技术有限公司 地址 272500 山东省济宁市汶上县经济开 发区泉河大道7 77号 (72)发明人 刘宾 李栓柱 袁绪彬 袁绪龙  贺庆壮 徐祥琦  (74)专利代理 机构 济宁仁礼信知识产权代理事 务所(普通 合伙) 37383 专利代理师 李琼 (51)Int.Cl. G06Q 10/06(2012.01)G06Q 50/06(2012.01) (56)对比文件 CN 112332853 A,2021.02.0 5 US 201231 1188 A1,2012.12.0 6 CN 112217521 A,2021.01.12 WO 2006025798 A1,20 06.03.09 刘博等.两种面向推荐系统的数据压缩方 法. 《计算机 工程与科 学》 .2016,(第1 1期), 唐小明等.基 于分段匹配的脉冲压缩检测算 法设计与实现. 《电光与控制》 .2017,(第0 3期), 审查员 孙旭 (54)发明名称 一种基于大数据的热力供需信息管理平台 (57)摘要 本发明涉及数据压缩技术领域, 具体涉及一 种基于大数据的热力供需信息 管理平台, 该系统 包括存储器和处理器, 所述处理器执行所述存储 器存储的计算机程序, 以实现如下步骤: 根据获 取的该热力供需数据序列, 得到该热力供需数据 序列对应的各子数据段; 根据各子数据段, 计算 各子数据段的变换必要性指标; 将变换必要性指 标大于等于必要性阈值的各子数据段进行处理, 得到各第一目标数据段; 根据各目标数据段中的 各元素, 获取各目标数据段对应的最长重复数据 段; 根据所述最长重复数据段的长度, 计算各目 标数据段对应的最优滑窗大小; 利用各目标数据 段对应的最优滑窗大小和LZ77压缩算法, 得到 各 子数据段的压缩信息 。 本发明提高了 压缩率。 权利要求书3页 说明书9页 附图1页 CN 115204754 B 2022.12.09 CN 115204754 B 1.一种基于大数据的热力供需信 息管理平台, 包括存储器和处理器, 其特征在于, 所述 处理器执行所述存储器存储的计算机程序, 以实现如下步骤: 获取采集到的任一类型的热力供需数据 序列; 根据该热力供需数据序列中的各元素, 对该热力供需数据序列进行分段, 得到该热力 供需数据 序列对应的各子数据段; 根据各子数据段中的各元素, 计算各子数据段对应的变换必要性指标; 将变换必要性 指标大于等于预设必 要性阈值的各子数据段记为第一数据段, 将 变换必要性指标小于预设 必要性阈值的各子数据段记为第二 目标数据段; 对各第一数据段进行变换处理, 得到变换 后的各第一数据段, 记为第一目标 数据段; 根据各目标数据段中的各元素, 获取各目标数据段对应的最长重复数据段; 根据所述 最长重复数据段的长度, 计算各目标数据段对应的最优滑 窗大小; 所述各目标数据段包括 各第一目标 数据段和各第二目标 数据段; 利用各目标数据 段对应的最优滑窗大小和LZ77压缩算法, 对各目标数据 段进行数据压 缩, 得到各子数据段的压缩信息; 所述根据各子数据段中的各 元素, 计算各子数据段对应的变换必要性指标, 包括: 对于任一子数据段对应的变换必要性指标的计算公式为: 其中, D为该子数据段对应的变换必要性指标, 为该子数据段中第i个数据类型出现 的概率, 为该子数据段中各数据类型出现的概率的均 值, n为该子数据段中的数据类型的 数量, 为该子数据段中第i个数据类型第o次连续出现的长度, 为该子数据段中第i个 数据类型 连续出现的次数, 为该子数据段中第i个数据类型 出现的次数; 对各第一数据段进行变换处理, 得到变换后的各第 一数据段, 记为第 一目标数据段, 包 括: 利用BWT算法对各第一数据段进行变换处 理, 得到变换后的各第一目标 数据段。 2.根据权利要求1所述的一种基于大数据的热力供需信 息管理平台, 其特征在于, 所述 根据该热力供需数据序列中的各元素, 对该热力供需数据序列进行分段, 得到该热力供需 数据序列对应的各子数据段, 包括: 设置初始数据段长度为m; 对于热力供需数据序列对应的第 一个子数据段: 按照该热力供需数据序列中元素的排 列顺序选取该热力供需数据序列中前m个元素; 计算该热力供需数据序列中前m个元素的熵 值, 判断所述前m个元素的熵值是否小于预设熵值阈值, 若小于, 则将所述前m个元素记 为第 一个子数据段; 若不小于, 则选取该热力供需数据序列中前m+1个元素, 计算该热力供需数 据序列中前m+1个元素的熵 值, 判断前m+1个元素的熵值是否小于预设熵值阈值, 若小于, 则 将该热力供需数据序列中前m+1个元素记 为第一个子数据段; 若不小于, 则继续递增元素数权 利 要 求 书 1/3 页 2 CN 115204754 B 2量, 直至该热力供需数据序列中前m+n1个元素对应的熵值小于预设熵值阈值, 则将该热力 供需数据序列中前m+n1个元素记为第一个子数据段; 其中, n1为第一个子数据段递增的数 据量; 将第一个子数据段中的元素数量记为G1; 从该热力供需数据序列中第G1+1个元素开 始, 选取该热力供需数据序列中连续的m个元素; 计算所述连续的m个元素的熵 值, 判断所述 连续的m个元素的熵值是否小于预设熵值阈值, 若小于, 则将所述连续的m个元素记为第二 个子数据段; 若不小于, 则依次类推直至得到该热力供需数据序列中连续的m+n2个元素对 应的熵值小于预设熵值阈值; 将该热力供需数据序列中连续m+n2个元素记 为第二个子数据 段; 其中, n2为第一个子数据段递增的数据量; 依次类推, 直至将该热力供需数据序列完全 划分, 得到该 热力供需数据 序列对应的各子数据段。 3.根据权利要求2所述的一种基于大数据的热力供需信 息管理平台, 其特征在于, 对于 分段过程中任意数量个元 素构成的数据段的熵值的计算公式为: 其中, 为该数据段的熵 值, G为该数据段中元素的数量, K为该数据段中的数据类型 的数量, 为该数据段中第j个数据类型 出现的概 率。 4.根据权利要求1所述的一种基于大数据的热力供需信 息管理平台, 其特征在于, 所述 根据各目标 数据段中的各 元素, 获取各目标数据段对应的最长 重复数据段, 包括: 对于任一目标 数据段: 将该目标数据 段的中点作为分隔点; 根据 该目标数据段的分隔点将该目标数据段分为 等长的两段, 将第一段记为不动段, 将第二段记为滑动段; 将滑动段与不动段的首部对齐, 将滑动段以步长为1的数据距离进行滑动, 直至找到最长重复数据段为止, 完成第一个循 环; 将该目标数据段的分隔点向前移动1个数据距离, 此时不动段中的元素个数为 , 滑 动段中的元素个数为 , 其中, B为该目标数据段中元素的总数量; 将滑动段与不动段的 首部对齐, 将滑动段以步长为1的数据距离进行滑动, 直至找到最长重复数据段为止, 完成 第二个循环; 以此类推, 直到获取 的最长重复数据段的长度等于不动段的长度时停止整个 循环; 根据每一 次循环获取到的最长重复数据段, 选择每次循环对应的最长重复数据段中长 度最大的最长 重复数据段作为该目标 数据段对应的最长 重复数据段。 5.根据权利要求1所述的一种基于大数据的热力供需信 息管理平台, 其特征在于, 所述 根据所述 最长重复数据段的长度, 计算各目标 数据段对应的最优滑窗大小, 包括: 对于任一目标 数据段: 其中, C为该目标数据段对应的最优滑窗大小, 为该目标数据段对应的最大重复数权 利 要 求 书 2/3 页 3 CN 115204754 B 3

.PDF文档 专利 一种基于大数据的热力供需信息管理平台

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于大数据的热力供需信息管理平台 第 1 页 专利 一种基于大数据的热力供需信息管理平台 第 2 页 专利 一种基于大数据的热力供需信息管理平台 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:35:08上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。