(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210166686.6
(22)申请日 2022.02.23
(71)申请人 中国电子科技 集团公司第二十八研
究所
地址 210000 江苏省南京市秦淮区苜蓿园
东街1号
(72)发明人 方婉盈 陈鹏 王妍妍 王玉坤
高菁 陈文颖
(74)专利代理 机构 江苏圣典律师事务所 32 237
专利代理师 于瀚文 胡建华
(51)Int.Cl.
G06Q 10/06(2012.01)
G06Q 50/26(2012.01)
G06F 16/951(2019.01)
G06F 40/30(2020.01)G06F 40/279(2020.01)
G06F 40/216(2020.01)
G06F 16/31(2019.01)
G06F 16/35(2019.01)
G06N 3/04(2006.01)
G06F 16/26(2019.01)
G06F 16/29(2019.01)
(54)发明名称
一种社会安全风险监测预警方法
(57)摘要
本发明提供了一种社会安全风险监测预警
方法, 能够自动持续地爬取社会安全风险相关数
据, 并且基于建立的社会安全事件 结构化表征模
型识别各类安全风险, 抽取出各类风险事件的关
键要素, 实现风险数据的结构化; 通过构建的多
级风险传导预 警模型, 实现各类社会安全风险以
及综合风险的动态监测, 并输出预测值。 本发明
还用于风险预测结果可视化并发送预警信息给
相应接收端, 能够展示一段时间内的风险变化走
势, 并将预警信息在地图上展现出来。 本发明对
安全事件进行分级分类, 建立了动态 监测预警模
型, 提高了社会安全风险预警的精准度。
权利要求书3页 说明书13页 附图2页
CN 114781778 A
2022.07.22
CN 114781778 A
1.一种社会安全风险监测预警方法, 其特 征在于, 包括以下步骤;
步骤1、 多元信息采集, 建立社会安全事件结构化表征模型, 对社会安全事件进行分类,
确定其关键要 素, 实现风险数据的结构化; 持续采集网络上的社会安全风险数据, 采用事件
语义抽取技术识别各类安全风险, 根据社会安全事件结构化表征模型抽取出各类风险事件
的相关信息, 存 入安全事件大数据库中;
步骤2、 风险预警, 构建多级风险传导预警模型, 从安全事件大数据库中获取风险数据,
根据风险数据超出阈值的范围来动态调整 各级指标的权重, 实现各类社会安全风险 以及综
合风险的动态监测, 并输出风险预测值;
步骤3、 风险态势监测, 将选定时间范围内的各类社会安全风险变化趋势进行可视化,
发送预警信息给相应接收端, 并将风险信息在地图上展现出来。
2.根据权利要求1所述的方法, 其特 征在于, 所述多元信息采集包括如下步骤:
步骤1‑1、 采用分布式网络爬虫技术和分布式数据预处理技术, 自动持续采集互联网公
开的社会安全风险数据, 通过动态自适应的定时接入技术, 汇 聚传感网和政务网的安全风
险非结构化文本数据;
步骤1‑2、 根据构建的社会安全事件结构化表征模型对非结构化文本进行语义抽取和
风险分类, 并且提取 出风险的关键要素, 存 入安全事件大数据库中。
3.根据权利要求2所述的方法, 其特 征在于, 步骤1 ‑2包括:
步骤1‑2‑1、 构建社会安全事件结构化表征模型, 对安全事件进行分类, 并确定每类事
件的基本属性, 将事 件作为一级指标, 将事 件的基本属性作为 二级指标;
步骤1‑2‑2、 数据清洗: 针对新闻、 论坛、 博客这类互联网来源 的数据, 剔除接入信息中
的广告、 导 航、 链接及未处 理的HTML脚本代码;
步骤1‑2‑3、 数据规范化: 对网页和文本类数据进行规范化, 将采集到的网页类型的数
据以文档对象模型DOM树的格式保存, 将文本类型的数据统一字符编码;
步骤1‑2‑4、 实体信息抽取: 对于经过数据清洗和数据规范化的非结构化文本, 采用实
体库匹配、 条件随机场CRF算法、 规则库流水线识别出文本中与风险有关的实体, 所述与风
险有关的实体包括时间、 地 点、 人物;
步骤1‑2‑5、 基于语义进行事件抽取: 从文本中提取出事件的发起者、 受害者、 经济损
失、 伤亡人数, 以及 事件的触发词, 从而将非结构化的句子转化为结构化的、 规范化的事件,
存入风险事 件对应的数据库表中;
步骤1‑2‑6、 根据社会安全事件结构化表征模型对事件的分类, 将实体、 事件要素、 触发
词及相应事 件存入风险事 件对应的数据库表中。
4.根据权利要求3所述的方法, 其特 征在于, 步骤1 ‑2‑4包括:
步骤1‑2‑4‑1, 将文本与实体库进行匹配, 将文本中匹配成功的词语识别为相关实体;
步骤1‑2‑4‑2, 对于实体库匹配不到的文本, 建立如下4种特 征模板:
词特征;
词性特征;
英文字母、 短横线及数字的组合特 征;
左、 右边界词和中心词特 征;
采用条件随机场CRF模型, 根据模板 完成实体的匹配识别;权 利 要 求 书 1/3 页
2
CN 114781778 A
2步骤1‑2‑4‑3, 对于没有识别的文本, 通过规则库进行实体匹配。
5.根据权利要求 4所述的方法, 其特 征在于, 步骤1 ‑2‑5包括:
步骤1‑2‑5‑1, 要素抽取及触发词抽取: 采用双向长短记忆Bi ‑LSTM和条件随机场 CRF模
型识别要 素和触发词, 进 行序列标注任务, 给句子中的每一个词都打上相应标签, 生成事件
要素和触发词的抽取 结果;
步骤1‑2‑5‑2, 触发词匹配事件元素: 使用卷积神经网络CNN模型进行分类匹配, 产 生触
发词与事 件要素的匹配结果。
6.根据权利要求5所述的方法, 其特 征在于, 步骤2包括如下步骤:
步骤2‑1、 基于社会安全事件样本, 通过熵值法确定各类安全风险事件中二级指标和一
级指标的权重, 确定二级指标的阈值、 一级指标的阈值和综合风险阈值, 根据阈值将安全风
险划分为 一般、 较重、 严重、 特别严重四个等级, 并存 入对应的数据库表中;
步骤2‑2、 确定时间区间, 从安全事件大数据库中抽取相应时间段内一级指标和对应二
级指标的安全事件实例, 根据事件实例中二级指标超出阈值的情况, 对事件实例下 的二级
指标的权重进行调整, 并对各项二级指标的值进行标准化处理, 根据调整后的二级指标权
重来计算 一级指标的预测值;
步骤2‑3、 根据二级指标超出阈值的情况, 对一级指标的权重进行调整, 根据一级指标
的预测值和调整后的权 重计算综合 风险的预测值;
步骤2‑4、 将综合风险的预测值以及各个一级指标的预测值输出到安全事件大数据库
中。
7.根据权利要求6所述的方法, 其特 征在于, 步骤2 ‑2包括如下步骤:
步骤2‑2‑1、 调整二级指标的权重: 在一个安全事件实例下, 如果存在一项二级指标的
值达到严重等级, 则把该安全事件实例下 的二级指标的权重进行调整, 根据调整后的权重
计算一级风险的预测值, 重新调整后二级指标权 重W2′i如下:
式中i∈F, F是安全事件实例下所有二级指标的集合, W2i、 W2j为调整前的二级指标权
重, E为安全事件实例下达到严重等级的二级指标集合, Ai、 Aj为权重系数, S2j为二级指标的
值, Tj为二级指标严重等级的下限值;
步骤2‑2‑2、 对二级指标的值进行标准化处理, 将各类二级指标较为严重等级的下限值
统一映射 为Y1, 特别严重等级的下限值统一映射 为Y2, 则二级指标值标准 化的公式如下:
式中Y1, Y2∈(0,100), S2i为二级指标的值, S2 ′i为二级指标值标准化后的值, T1i为较
为严重等级的下限值, T2i为特别严重等级的下限值;
步骤2‑2‑3、 计算一级指标的预测值: 一级指标 预测值S1i的计算公式为:权 利 要 求 书 2/3 页
3
CN 114781778 A
3
专利 一种社会安全风险监测预警方法
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:28上传分享