说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210452919.9 (22)申请日 2022.04.27 (71)申请人 西南科技大 学 地址 621010 四川省绵阳市青龙 大道中段 59号 (72)发明人 张红英 卢琇雯 韩雪 张奇 (51)Int.Cl. G06V 40/16(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种双支路 混合残差连接的表情识别方法 (57)摘要 本发明给出一种双支路混合残差连接的表 情识别方法。 具体包括: 以ResNet18为主干特征 提取网络, 在此基础上设计双支路的多残差连接 方式, 完善 特征提取; 其次, 综合分析网络深度以 及宽度两方面问题, 融合深度可分离卷积, 构建 轻量级的表情识别网络; 最后, 根据人脸表情信 息特点, 为了获取更加精准、 完善的特征信息, 添 加自适应特征融合模块ASFF, 并对融合后的信息 进行分析验证, 选取表现最为优越的层级输出, 进行最终的表情分类预测。 本发 明结合完善的特 征提取机制与自适应特征融合方式, 并将普通卷 积替换为深度可分离卷积, 可以解决表情识别在 非受控条件 下的识别精度、 以及模 型的轻量化问 题。 权利要求书2页 说明书5页 附图2页 CN 114863522 A 2022.08.05 CN 114863522 A 1.一种双支路混合残差连接的表情识别方法, 其特征在于, 引入一种双支路的特征提 取网络, 采用混合残差连接方式完善特征提取机制, 并添加自适应特征融合模块ASFF联合 所提取的特征信息, 最后进行模型轻量化; 包括基础图像数据增强、 双支路混合特征提取、 自适应特 征融合ASF F、 模型轻量化以及实验测试五个部分: 第一部分包括两个步骤: 步骤1, 对图片进行随机缩放裁 剪, 其次对图片数据进行 水平翻转, 以增 加图片数据库; 步骤2, 使用mixup图片融合以及label_smoothing标签平滑方式对图片数据进一步增 强, 使得训练所 得模型具有更好的泛化能力; 第二部分包括两个步骤: 步骤3, 主支路是对ResNet 18结构进行了修改: 首先输入图片数据对应为通道数 ×图片 高度×图片宽度, 对应大小为1 ×40×40, 由于图片尺寸较小, 输入数据首先进行基础3 ×3 卷积, 然后输入 各layer层 进行特征提取, 之后再经过全局平均池化后传入全连接层 进行表 情的7分类预测; 步骤4, 次支路首先对原始 ResNet18网络的连接方式进行了简单修改: 主支路残差连接 块不变; 从多尺度方面出发, 选择使用1 ×1卷积核进 行次支路部 分的特征提取, 能够最大限 度保留来自原 始输入图片的信息, 并对最后的分类结果产生积极影响。 具体实施如下: (1) 将输入图片数据使用1 ×1卷积核大小从另一支路依次进行下采样, 在融合对应残 差连接块的特征信息后, 作为下一次1 ×1卷积的输入, 直至与最后一层残差连接块进行融 合; (2) 进行混合残差操作后的特征信息不送入主支路网络进行特征提取, 而是单独作为 尺度1特征输出, 在最后连接主干残差块的残差信息; 最后将主支路网络以及尺度1支路所 得各尺度信息进行 特征融合, 经由全连接层融合全局特 征用于表情分类; 第三部分包括两个步骤: 步骤5, 添加自适应特征融合模块ASFF将特征提取部分获取的大量多尺度表情信息, 通 过学习权重参数 的方式将不同层的特征融合到一起, 保证特征信息完善, 并在一定程度去 除产生的特 征冗余; 步骤6, 对ASF F各层级结果分别输出, 并进行最终的表情分类预测; 具体实施如下: (1) 首先从特征提取主干网络中提取出三个不同尺寸的层级, 选定其中一个层级后, 对 其他两个层级进行上采样或下采样, 使三个层级尺寸相合, 然后选择第一层级作为输出, 也 就是对应的 输出, 选择融合的三个层级分别为 Level0对应尺寸为512 ×5×5,Level1 对应尺寸 为256×10×10,Level2对应尺寸 为128×20×20; (2) 三个层级经由ASFF模块进行自适应特征融合, 对三个层级特征图生成 自适应特征 权重, 并通过softmax将数值范围控制在[0,1], 最后的结果经由全局平局池化后进行最后 的表情预测; 第四部分包括 一个步骤: 步骤7, 将普通卷积替换为深度可分离卷积, 减少由于网络加深带来的巨大参数量, 具 体实施如下: 由于整体在经过多次下采样后, 通道数已经达到了512, 因此将ResNet18的layer4层中 的最后一层卷积替换为深度可分离卷积以减少参数;权 利 要 求 书 1/2 页 2 CN 114863522 A 2第五部分包括两个步骤: 步骤8, 调试从步骤2到步骤7的网络结构超参数, 设置 网络模型参数, 其中, 主要超参数 学习率设定为0. 1, Epochs设置为300, Bach size设置为64, 采用SGD 优化器, 并得到最终的 训练模型; 步骤9, 下载非受控表情识别数据 集FER2013, 按照步骤8所设定训练好的模型进行训练 以及测试。 2.根据权利要求1所述的一种双支路混合残差连接的表情识别方法, 其特征在于, 步骤 4使用双支路混合残差连接网络进行 特征提取。 3.根据权利要求1所述的一种双支路混合残差连接的表情识别方法, 其特征在于, 步骤 6使用自适应特征融合模块ASFF, 融合特征提取网络的不同尺度信息, 生成自适应权重, 并 在一定程度上丢弃冗余以及无效信息, 以得到性能的提升 。 4.根据权利要求1所述的一种双支路混合残差连接的表情识别方法, 其特征在于, 步骤 7中将ResNet18的layer4层中的最后一层卷积替换为深度可分离卷积以减少参数, 使模型 轻量化。权 利 要 求 书 2/2 页 3 CN 114863522 A 3
专利 一种双支路混合残差连接的表情识别方法
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 07:31:56
上传分享
举报
下载
原文档
(430.4 KB)
分享
友情链接
T-SZCC 001—2023 深圳市生物医药产业“工业上楼” 设计指引.pdf
T-CRHA 015—2023 成人经鼻高流量氧疗护理规范.pdf
DB4413-T 35-2023 金线莲栽培技术规范 惠州市.pdf
GM-T 0008-2012 安全芯片密码检测准则.pdf
GB-T 32649-2016 光伏用高纯石英砂.pdf
奇安信 中国实战化白帽人才能力白皮书.pdf
民航 MH-T 6050-2009 行李处理系统 带式输送机.pdf
GB-T 16746-2018 锌合金铸件.pdf
T-SDXXHQ 002—2022 山东省中小学学生配餐营养设计指南.pdf
山石网科《岩谈》第五期-2022年4月(数据安全专刊).pdf
NY-T 4205-2022 农作物品种数字化管理数据描述规范.pdf
CH-T 4024-2019 《城市政务电子地图更新技术规范》.pdf
密码学会 政务信息系统密码应用与安全性评估 工作指南-2020.pdf
红蓝对抗-红队作战手册.pdf
GB-T 29101-2012 道路交通信息服务 数据服务质量规范.pdf
GB-T 32059-2015 高速动车组车窗、车门抗风压载荷疲劳试验方法.pdf
NIST.SP.800-53Ar4 Assessing Security and Privacy Controls in Federal Information Systems and Organizations.pdf
GB-T 17874-2021 电子特气 三氯化硼.pdf
GM-T 0065-2019 商用密码产品生产和保障能力建设规范.pdf
第三方人员安全管理制度.pdf
1
/
3
10
评价文档
赞助2.5元 点击下载(430.4 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。