说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210913815.3 (22)申请日 2022.08.01 (71)申请人 北京理工大 学 地址 100081 北京市海淀区中关村南大街5 号 申请人 中国科学院大学 (72)发明人 杨晨 王颍超 兰舒琳 祝烈煌 (51)Int.Cl. G06V 10/80(2022.01) G06V 10/82(2022.01) G06F 40/216(2020.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/30(2022.01) G06V 10/774(2022.01) (54)发明名称 一种基于图像式中间态的多模态数据融合 决策方法 (57)摘要 本发明公开了一种基于图像式中间态的多 模态数据融合决策方法, 包括确定决策任务涉及 的多模态数据; 设计多模态数据统一转换为图像 模态数据的方法; 面向决策任务获取多模态样本 数据, 并统一为图像模态以构造训练集和测试 集; 基于训练集和测试集, 训练融合注意力机制 的多通道深度神经网络; 采集用于决策的多模态 数据, 并统一转换为图像模态以构造决策数据 集; 将决策数据集输入多通道深度神经网络进行 特征自适应提取与融合决策。 本发 明既避免了多 特征提取模型导致的复杂网络设计和大量参数 寻优问题, 又可方便地、 仅使用一个硬件加速设 备来完成快速的神经网络计算; 增强深度神经网 络各通道 提取特征的交互性和互补性; 减少冗余 特征的输入。 权利要求书2页 说明书9页 附图2页 CN 115393678 A 2022.11.25 CN 115393678 A 1.一种基于图像式 中间态的多模态数据融合决策 方法, 包括以下步骤: 确定决策任务涉及的多模态数据; 设计多模态数据统一 转换为图像模态数据的方法; 面向任务获取多模态样本数据, 并统一 为图像模态以构造训练集和 测试集; 基于训练集和 测试集, 设计和训练融合注意力机制的多通道深度神经网络; 采集用于决策的多模态数据, 并统一 为图像模态以构造决策 数据集; 将决策数据集输入多通道深度神经网络进行 特征自适应提取与融合决策。 2.根据权利要求1所述方法, 其特 征在于, 确定决策任务涉及的多模态数据, 包括: 面向决策任务需求, 结合实际场景条件, 综合考虑数据可获得性、 可用性、 可靠性, 确定 用于决策任务的多模态数据, 可选的多模态数据包括日志/文档等文本数据、 振动信号/声 信号/电流信号 等信号数据、 RGB图像/RGB ‑D图像/红外图像等图像数据、 视频 数据等。 3.根据权利要求1所述方法, 其特征在于, 设计多模态数据统一转换为图像模态数据的 方法, 包括: 对多模态数据进行 预处理; 将预处理后的多模态数据转换为图像模态数据。 4.根据权利要求3所述方法, 其特 征在于, 对多模态数据进行 预处理, 包括: 可选的, 对于文本数据, 在一种可实现方式中, 使用正则清洗文本数据, 剔除脏数据和 进行指定条件的数据筛 选; 可选的, 对于时域信号数据, 在一种可实现方式 中, 利用小 波分解进行降噪处 理; 可选的, 对于图像和视频 数据, 在一种可实现方式 中, 利用滤波器进行降噪处 理。 5.根据权利要求3所述方法, 其特征在于, 将预处理后的多模态数据转换为图像模态数 据, 包括: 可选的, 对于文本数据, 在一种可实现方式中, 统计文本中词频数据, 将文本数据转换 为一维词频 数据, 并将一维词频 数据归一 化为灰度值, 排列为 二维矩阵以转换为灰度图像; 可选的, 对于信号数据, 在一种可实现方式中, 通过傅里叶变换从预处理后的时域信号 数据中获取频域信息, 将所述时域信号数据与频域数据归一化为灰度值, 并排列为二维矩 阵以转换成灰度图像; 在一种可实现方式中, 通过短时傅里叶变换或小波变换或S 变换等时 频分析方法, 将预处 理后的时域信号数据转换为 二维时频图; 可选的, 对于视频数据, 在一种可实现方式中, 从预处理后的视频数据中提取关键帧; 在一种可实现方式 中, 从预处 理后的视频 数据中提取二维光 流场图。 6.根据权利要求1所述方法, 其特征在于, 面向任务获取多模态样本数据, 并统一为图 像模态以构造训练集和 测试集, 包括: 在同一时间段内, 面向同一对象或场景, 采集决策任务涉及的多模态样本数据; 基于上述多模态数据统一转换为图像模态数据的方法, 将采集的多模态样本数据统一 为图像模态数据; 对统一之后的图像模态数据集进行 标注, 并将其划分为训练集和 测试集。 7.根据权利要求1所述方法, 其特征在于, 基于训练集和测试集, 设计和训练融合注意 力机制的多通道深度神经网络, 包括: 设计融合注意力 机制的多通道深度神经网络, 注意力 机制包括通道注意力 机制和空间权 利 要 求 书 1/2 页 2 CN 115393678 A 2注意力机制; 基于训练集和 测试集, 对融合注意力机制的多通道深度神经网络进行训练和调整。 8.根据权利要求1所述方法, 其特征在于, 采集用于决策的多模态数据, 并统一为图像 模态以构造决策 数据集, 包括: 在同一时间段内, 面向同一对象或场景, 采集待决策的多模态数据; 基于上述多模态数据统一转换为图像模态数据的方法, 将采集的多模态数据统一为图 像模态数据, 组成决策 数据集。 9.根据权利要求1所述方法, 其特征在于, 将决策数据集输入多通道深度神经网络进行 特征自适应提取与融合决策, 包括: 将统一为图像模态的决策数据集输入已训练好的融合注意力机制的多通道深度神经 网络进行 特征自适应提取与决策, 输出决策 结果。权 利 要 求 书 2/2 页 3 CN 115393678 A 3
专利 一种基于图像式中间态的多模态数据融合决策方法
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 10:10:28
上传分享
举报
下载
原文档
(667.0 KB)
分享
友情链接
GB-T 34346-2017 基于风险的油气管道安全隐患分级导则.pdf
GB-T 33174-2022 资产管理 管理体系 GB-T 33173应用指南.pdf
R155e.pdf
MZ-T 157-2020 手动移位车.pdf
GB-T 30428.6-2017 数字化城市管理信息系统 第6部分:验收.pdf
艾瑞咨询2024年AIGC教育行业报告55页.pdf
T-CFA 020101161—2020 铸造高速钢轧辊.pdf
T-CSAE 78—2018 电动汽车再生制动平顺性的评价 及试验方法.pdf
GB-T 42560-2023 系统与软件工程 开发运维一体化 能力成熟度模型.pdf
GB-T 37966-2019 纳米技术 氧化铁纳米颗粒类过氧化物酶活性测量方法.pdf
GB-T 33645-2017 钢、镍及镍合金的激光-电弧复合焊接工艺评定试验.pdf
GB-T 22186-2016 信息安全技术 具有中央处理器的IC卡芯片安全技术要求.pdf
T-CDJC 003—2022 交联聚乙烯卷材浮筑楼板隔声保温系统应用技术标准.pdf
NY-T 536-2017 鸡伤寒和鸡白痢诊断技术.pdf
T-ACEF 065—2023 重金属污染土壤生态风险评估技术指南.pdf
DB51-T 2738-2020 大熊猫圈养机构宣传教育标准 四川省.pdf
GB-T 31499-2015 信息安全技术 统一威胁管理产品技术要求和测试评价方法.pdf
GB-T 20979-2019 信息安全技术 虹膜识别系统技术要求.pdf
GM-T 0122-2022 区块链密码检测规范.pdf
GB-T 39399-2020 北斗卫星导航系统测量型接收机通用规范.pdf
1
/
3
14
评价文档
赞助2.5元 点击下载(667.0 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。