(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210699477.8
(22)申请日 2022.06.20
(65)同一申请的已公布的文献号
申请公布号 CN 115015120 A
(43)申请公布日 2022.09.06
(73)专利权人 厦门宇昊软件 有限公司
地址 361000 福建省厦门市 火炬高新区火
炬园火炬 北路17号 二楼
(72)发明人 周宇 粟放
(74)专利代理 机构 厦门仕诚联合知识产权代理
事务所(普通 合伙) 35227
专利代理师 乐珠秀
(51)Int.Cl.
G01N 21/01(2006.01)
G01N 21/35(2014.01)(56)对比文件
CN 114397262 A,202 2.04.26
CN 111476422 A,2020.07.31
CN 105424185 A,2016.0 3.23
CN 110361373 A,2019.10.2 2
US 20141 14601 A1,2014.04.24
杨荣新等.基于Stacking模型融合的光伏发
电功率预测. 《计算机系统应用》 .2020,第2 9卷
(第05期),第3 6-45页.
孙彦华等.近红外光谱分析中温度影响的修
正. 《光谱学与光谱分析》 .2020,第40卷(第0 6
期),第1690 -1695页.
张宇峰等.红外光谱发射 率测量系统的温漂
修正方法. 《光谱学与光谱分析》 .2016,第3 6卷
(第9期),第3 003-3007页.
审查员 张佳宁
(54)发明名称
一种傅里叶红外光谱仪及其温漂在线校正
方法
(57)摘要
本发明公开了一种傅里叶红外光谱仪及其
温漂在线校正方法, 其通过 获取傅里叶红外光谱
仪采集的光谱 数据; 对所述光谱 数据进行数据清
洗和数据归一化处理; 对所述光谱 数据提取如下
特征: 波长、 光强、 待校正温度, 并对波长和光强
进行特征融合, 得到融合特征; 将所述待校正温
度和所述融合特征输入Stacking集成模型进行
数据训练或预测; 其中, 所述Stacking集成模型
包括两层, 第一层采用LightGBM模型, 第二层采
用多元线性回归模型; 最后, 将所述Stacking集
成模型的输出值反归一化为标准温度下的光强
值; 能将非标准温度下测得的光谱曲线校准为标
准温度下的光谱曲线, 最终得到在线光谱仪温漂
校正结果, 具有普适性、 精确性和高效率等优点,
提升光谱仪适用范围和精度。
权利要求书4页 说明书11页 附图5页
CN 115015120 B
2022.12.20
CN 115015120 B
1.一种温漂在线校正方法, 其特 征在于, 包括以下步骤:
步骤 (1) , 获取傅里叶红外光谱仪采集的光谱数据;
步骤 (2) , 对所述光谱数据进行数据清洗和数据归一化处理; 所述数据清洗包括小波变
换和中值滤波处 理;
步骤 (3) , 对所述光谱数据提取如下特征: 波长、 光强、 待校正温度, 并对波长和光强进
行特征融合, 得到融合特 征;
步骤 (4) , 将所述待校正温度和所述融合特征输入Stacking集成模型进行数据训练或
预测; 其中, 所述Stacking集成模型包括两层, 第一层采用LightGBM模型, 第二层采用多元
线性回归 模型;
步骤 (5) , 将所述Stack ing集成模型的输出值反归一 化为标准温度下的光强值。
2.根据权利要求1所述的一种温漂在线校正方法, 其特征在于, 所述的步骤 (2) 中, 所述
数据清洗进一 步包括:
步骤 (21) , 选择sym8为小波基, 分解层 数为3层, 对光谱数据进行三级小波变换, 得到低
频系数和高频系数;
步骤 (22) , 对所述高频系数使用固定阈值进行阈值 化处理;
步骤 (23) , 将所述低频系数和阈值化处理后的高频系数通过小波重构, 得到初步去噪
数据;
步骤 (24) , 对初步去燥后的高频系数 再使用中值滤波处 理;
步骤 (25) , 将初步去燥后的低频系数和中值滤波处理后的高频系数重构为清洗后数
据。
3.根据权利要求1所述的一种温漂在线校正方法, 其特征在于, 所述的步骤 (2) 中, 所述
数据归一化处理, 是指对所述光谱数据进行Z ‑socre标准化, 标准化公式为
; 其中,
为
的平均值,
为标准差, 标准化后的数据符合标准正态分布, 即均值为0, 标
准差为1。
4.根据权利要求1所述的一种温漂在线校正方法, 其特征在于, 所述的步骤 (3) 中, 对波
长和光强进行 特征融合, 进一 步包括:
步骤(31), 用高斯分布计算波长和光强之间的融合前距离, 高斯分布的公式为
;
表示中心为高维空间中一点
时, 高维空间中另 一点
是其临近点的概率;
均为高维空间中某一点的坐标值;
为不同的中心点
对应的高斯分布的方差;
步 骤(3 2), 用t分 布计算 波长 和光强 之间融 合 后距离 , t分 布的 公式 为
;
、
、
为高维空间中
映射到低维空间中的点;权 利 要 求 书 1/4 页
2
CN 115015120 B
2表示中心为低维空间中一 点
时, 低维空间中另一 点
是其临近点的概 率;
步骤 (33) , 用KL距离计算所述融合前距离和所述融合后距离是否一样, 即, 计算所述 高
斯分布和所述t分布是否相似, KL距离的公 式为
;
为高斯分布中表示中心为高维空间中一点
时, 高维空间中另一点
是其临近点的概
率;
表示中心为低维空间中一 点
时, 低维空间中另一 点
是其临近点的概 率;
步骤 (34), 通过梯度下降法的不断迭代和缩小所述KL距离, 梯度下降法的公式为
; C为上述两分布的KL距离,
、
为低维
空间中的某一点,
表示中心为高维空间中一点
时, 高维空间中另一点
是其临近点的
概率;
表示中心为高维空间中一点
时, 高维空间中另一点
是其临近点的概率;
表示中心为低维空间中一点
时, 低维空间中另一点
是其临近点 的概率,
表示中心
为低维空间中一 点
时, 低维空间中另一 点
是其临近点的概 率。
5.根据权利要求1所述的一种温漂在线校正方法, 其特征在于, 所述的步骤 (4) 中, 所述
LightGBM模型的训练进一 步包括:
步骤 (41) , 使用直方图算法寻找最佳分裂节点:首先对每个特征的取值离散化, 然后构
建一个宽度为K的直方图, 实现用直方图代替原有的数据, 最后将借助于构建的直方图遍历
数据, 计算每段样本中的梯度和样本数量用来 寻找最优分裂节点;
步骤 (42) , 使用基于梯度的单边采样方法GOSS进行数据采样: 首先根据样本点的梯度
的绝对值对所述样本点进行降序排序, 然后根据设定好的大梯度数据采样率a在排序后的
结果中选取样本生成一个大梯度样本点的子集; 然后, 对剩下的样本集合 (1 ‑a) 的样本, 根
据设定好的小梯度数据采样率b, 随机地选取b •(1‑a)×100%个样本点, 生成一个小梯度样
本点的集合; 接着, 将大梯度样本和采样的小梯度样本合并, 将小梯度样本乘上一个权重系
数(1‑a)/b; 并且, 使用上述的采样的样本, 学习 一个新的弱学习器; 最后, 不断地重复前述
步骤直到 达到预设的迭代次数或者收敛为止;
步骤 (43) , 使用互斥特征捆绑进行特征采样: 首先构造一个带有权重的图, 其权值对应
于特征之间的总冲突; 然后通过特征在图中的环长度来降序排序特征; 最后检查上述排序
好的每个特征, 确保特 征捆绑集 合的冲突数不会大于最大冲突阈值。
6.根据权利要求1所述的一种温漂在线校正方法, 其特征在于, 所述的步骤 (4) 中, 所述
多元线性回归 模型的训练进一 步包括:
步骤 (44) , 导入所述 LightGBM模型的输出值, 建立初始多元线性回归 模型;
步骤 (45) , 以均方误差为损失函数, 公式为权 利 要 求 书 2/4 页
3
CN 115015120 B
3
专利 一种傅里叶红外光谱仪及其温漂在线校正方法
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 01:03:19上传分享