专利 一种基于大数据的热力供需信息管理平台

(19)国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202211118065.7 (22)申请日 2022.09.15 (65)同一申请的已公布的文献号申请公布号 CN 115204754 A (43)申请公布日 2022.10.18 (73)专利权人山东西曼克技术有限公司地址 272500 山东省济宁市汶上县经济开发区泉河大道7 77号 (72)发明人刘宾　李栓柱　袁绪彬　袁绪龙　贺庆壮　徐祥琦　 (74)专利代理机构济宁仁礼信知识产权代理事务所(普通合伙) 37383 专利代理师李琼 (51)Int.Cl. G06Q 10/06(2012.01)G06Q 50/06(2012.01) (56)对比文件 CN 112332853 A,2021.02.0 5 US 201231 1188 A1,2012.12.0 6 CN 112217521 A,2021.01.12 WO 2006025798 A1,20 06.03.09 刘博等.两种面向推荐系统的数据压缩方法. 《计算机工程与科学》 .2016,(第1 1期), 唐小明等.基于分段匹配的脉冲压缩检测算法设计与实现. 《电光与控制》 .2017,(第0 3期), 审查员孙旭 (54)发明名称一种基于大数据的热力供需信息管理平台 (57)摘要本发明涉及数据压缩技术领域，具体涉及一种基于大数据的热力供需信息管理平台，该系统包括存储器和处理器，所述处理器执行所述存储器存储的计算机程序，以实现如下步骤：根据获取的该热力供需数据序列，得到该热力供需数据序列对应的各子数据段；根据各子数据段，计算各子数据段的变换必要性指标；将变换必要性指标大于等于必要性阈值的各子数据段进行处理，得到各第一目标数据段；根据各目标数据段中的各元素，获取各目标数据段对应的最长重复数据段；根据所述最长重复数据段的长度，计算各目标数据段对应的最优滑窗大小；利用各目标数据段对应的最优滑窗大小和LZ77压缩算法，得到各子数据段的压缩信息。本发明提高了压缩率。权利要求书3页说明书9页附图1页 CN 115204754 B 2022.12.09 CN 115204754 B 1.一种基于大数据的热力供需信息管理平台，包括存储器和处理器，其特征在于，所述处理器执行所述存储器存储的计算机程序，以实现如下步骤：获取采集到的任一类型的热力供需数据序列；根据该热力供需数据序列中的各元素，对该热力供需数据序列进行分段，得到该热力供需数据序列对应的各子数据段；根据各子数据段中的各元素，计算各子数据段对应的变换必要性指标；将变换必要性指标大于等于预设必要性阈值的各子数据段记为第一数据段，将变换必要性指标小于预设必要性阈值的各子数据段记为第二目标数据段；对各第一数据段进行变换处理，得到变换后的各第一数据段，记为第一目标数据段；根据各目标数据段中的各元素，获取各目标数据段对应的最长重复数据段；根据所述最长重复数据段的长度，计算各目标数据段对应的最优滑窗大小；所述各目标数据段包括各第一目标数据段和各第二目标数据段；利用各目标数据段对应的最优滑窗大小和LZ77压缩算法，对各目标数据段进行数据压缩，得到各子数据段的压缩信息；所述根据各子数据段中的各元素，计算各子数据段对应的变换必要性指标，包括：对于任一子数据段对应的变换必要性指标的计算公式为：其中， D为该子数据段对应的变换必要性指标，为该子数据段中第i个数据类型出现的概率，为该子数据段中各数据类型出现的概率的均值， n为该子数据段中的数据类型的数量，为该子数据段中第i个数据类型第o次连续出现的长度，为该子数据段中第i个数据类型连续出现的次数，为该子数据段中第i个数据类型出现的次数；对各第一数据段进行变换处理，得到变换后的各第一数据段，记为第一目标数据段，包括：利用BWT算法对各第一数据段进行变换处理，得到变换后的各第一目标数据段。 2.根据权利要求1所述的一种基于大数据的热力供需信息管理平台，其特征在于，所述根据该热力供需数据序列中的各元素，对该热力供需数据序列进行分段，得到该热力供需数据序列对应的各子数据段，包括：设置初始数据段长度为m；对于热力供需数据序列对应的第一个子数据段：按照该热力供需数据序列中元素的排列顺序选取该热力供需数据序列中前m个元素；计算该热力供需数据序列中前m个元素的熵值，判断所述前m个元素的熵值是否小于预设熵值阈值，若小于，则将所述前m个元素记为第一个子数据段；若不小于，则选取该热力供需数据序列中前m+1个元素，计算该热力供需数据序列中前m+1个元素的熵值，判断前m+1个元素的熵值是否小于预设熵值阈值，若小于，则将该热力供需数据序列中前m+1个元素记为第一个子数据段；若不小于，则继续递增元素数权　利　要　求　书 1/3 页 2 CN 115204754 B 2量，直至该热力供需数据序列中前m+n1个元素对应的熵值小于预设熵值阈值，则将该热力供需数据序列中前m+n1个元素记为第一个子数据段；其中， n1为第一个子数据段递增的数据量；将第一个子数据段中的元素数量记为G1；从该热力供需数据序列中第G1+1个元素开始，选取该热力供需数据序列中连续的m个元素；计算所述连续的m个元素的熵值，判断所述连续的m个元素的熵值是否小于预设熵值阈值，若小于，则将所述连续的m个元素记为第二个子数据段；若不小于，则依次类推直至得到该热力供需数据序列中连续的m+n2个元素对应的熵值小于预设熵值阈值；将该热力供需数据序列中连续m+n2个元素记为第二个子数据段；其中， n2为第一个子数据段递增的数据量；依次类推，直至将该热力供需数据序列完全划分，得到该热力供需数据序列对应的各子数据段。 3.根据权利要求2所述的一种基于大数据的热力供需信息管理平台，其特征在于，对于分段过程中任意数量个元素构成的数据段的熵值的计算公式为：其中，为该数据段的熵值， G为该数据段中元素的数量， K为该数据段中的数据类型的数量，为该数据段中第j个数据类型出现的概率。 4.根据权利要求1所述的一种基于大数据的热力供需信息管理平台，其特征在于，所述根据各目标数据段中的各元素，获取各目标数据段对应的最长重复数据段，包括：对于任一目标数据段：将该目标数据段的中点作为分隔点；根据该目标数据段的分隔点将该目标数据段分为等长的两段，将第一段记为不动段，将第二段记为滑动段；将滑动段与不动段的首部对齐，将滑动段以步长为1的数据距离进行滑动，直至找到最长重复数据段为止，完成第一个循环；将该目标数据段的分隔点向前移动1个数据距离，此时不动段中的元素个数为，滑动段中的元素个数为，其中， B为该目标数据段中元素的总数量；将滑动段与不动段的首部对齐，将滑动段以步长为1的数据距离进行滑动，直至找到最长重复数据段为止，完成第二个循环；以此类推，直到获取的最长重复数据段的长度等于不动段的长度时停止整个循环；根据每一次循环获取到的最长重复数据段，选择每次循环对应的最长重复数据段中长度最大的最长重复数据段作为该目标数据段对应的最长重复数据段。 5.根据权利要求1所述的一种基于大数据的热力供需信息管理平台，其特征在于，所述根据所述最长重复数据段的长度，计算各目标数据段对应的最优滑窗大小，包括：对于任一目标数据段：其中， C为该目标数据段对应的最优滑窗大小，为该目标数据段对应的最大重复数权　利　要　求　书 2/3 页 3 CN 115204754 B 3

专利 一种基于大数据的热力供需信息管理平台

专利一种基于大数据的热力供需信息管理平台