当前位置: 首页 > web >正文

2025认证杯二阶段C题完整论文讲解+多模型对比

基于延迟估计与多模型预测的化工生产过程不合格事件预警方法研究

摘要

化工生产过程中,污染物浓度如SO₂和H₂S对生产过程的控制至关重要。本文旨在通过数据分析与模型预测,提出一种基于延迟估计与特征提取的多模型预测方法,优化阈值设置,及时预警潜在的不合格事件。

在数据处理阶段,我们首先进行了数据的预处理、基本统计分析、百分位数计算与阈值选择,结合阈值敏感性分析评估了阈值变化对合格率的影响。通过这一过程,确定了不同百分位数的阈值,并使用多种阈值组合选择方法,以最大化合格率。同时,应用三种先进的异常检测方法——ROC曲线优化、One-Class SVM和高斯混合模型(GMM),对SO₂和H₂S浓度的异常阈值进行了对比研究。

针对延时分析模型,我们提出了两种方法:互相关分析和差分响应法,用于估计输入反应物流量变化对SO₂和H₂S浓度响应的延迟。互相关分析通过计算输入与输出之间的相关系数,识别最大相关性对应的延迟时间;而差分响应法通过识别输入信号中的显著变化点,验证延迟的准确性。

针对预测模型的构建,我们结合延迟估计与特征提取,采用分类模型预测是否发生不合格事件,并利用回归模型预测不合格事件的发生时间。通过对模型准确率、精确率、召回率和F1分数的评估,验证了预测模型的有效性与性能。

最后,我们的研究提出了一种基于延迟估计和特征提取的多模型预测方法,能够有效预测不合格事件并提供提前预警。该方法为化工生产过程中的控制策略设计提供了新的思路和技术支持。

关键词:延迟估计;阈值设置;多模型预测;分类模型;回归模型

一、模型假设

为了方便模型的建立与模型的可行性,我们这里首先对模型提出一些假设,使得模型更加完备,预测的结果更加合理。

1、假设化工生产过程中,SO₂和H₂S的浓度受多个反应过程参数的影响,且污染物浓度的变化与输入流量、反应条件等因素紧密相关。

2、假设输入数据(包括反应物流量和污染物浓度)是准确和及时获取的,且数据质量良好,没有遗漏或异常值。

3、假设在实际应用中,延迟和阈值的设置会根据实际生产过程和数据反馈进行适当调整,以应对不同生产环境和操作条件下的变化。

二、模型的建立与求解

5.1 阈值确定

在本次分析中,我们主要目的是通过数学方法分析并确定化工厂脱硫工艺中的污染物SO₂和H₂S浓度的阈值,并为生产过程中的控制提供理论支持。分析过程包括数据的预处理、统计分析、百分位数分析、阈值选择、敏感性分析等步骤,旨在通过精确的控制阈值保证产品质量。

5.1.1 数据预处理

首先,加载了输入输出数据,其中输入数据包含工艺参数,而输出数据则是
 和
 的浓度。数据清洗过程中,我们需要确保数据结构的正确性,例如去除表头行,确保每个数据项都是数值型数据。通过这些预处理步骤,我们确保了分析数据的质量。

图片

这些统计量帮助我们理解数据的基本分布特性,例如污染物浓度的波动范围与离散程度。

SO2统计信息:

最小值: -5.2016

最大值: 13.9642

平均值: -0.0000

标准差: 1.0000

H2S统计信息:

最小值: -5.9891

最大值: 7.6372

平均值: 0.0000

标准差: 1.0000

从SO₂和H₂S的统计信息来看,SO₂浓度的最小值为-5.2016,最大值为13.9642,表明SO₂浓度在测量过程中存在一定的波动,涵盖了负值和正值,这可能与测量误差或数据处理中的异常值有关。SO₂的平均值接近零,标准差为1,表明其浓度波动相对较小,数据相对集中。对于H₂S,最小值为-5.9891,最大值为7.6372,同样存在负值,可能是由于数据异常或测量误差导致。H₂S的平均值为0,标准差也为1,显示其浓度在整体上呈现较为均匀的分布,波动幅度不大。整体来看,SO₂和H₂S的数据呈现出一定的波动性和异常值的存在,可能需要进一步的数据清洗和异常值处理。

图片

图片

百分位数 SO2阈值           H2S阈值          

----------------------------------------

50 0.1648          -0.0037        

75 0.6439          0.5057         

80 0.7398          0.6331         

85 0.8356          0.8878         

90 1.0273          1.0151         

95 1.4106          1.5245         

97 1.6022          1.7792         

98 1.8897          2.1612         

99 2.2730          2.6706         

图片

图片

通过计算不同百分位数组合对应的合格率,我们可以选择最优的阈值组合。我们进一步尝试不同的百分位数组合,如
 、
 、
 等,以找出使得合格率最大化的阈值组合。

不同阈值组合下的结果:

SO2阈值 H2S阈值      SO2百分位数         H2S百分位数         合格率

-----------------------------------------------------------------

0.8356 0.8878     85              85              0.7448

0.8356 1.0151     85              90              0.7645

0.8356 1.5245     85              95              0.8173

0.8356 1.7792     85              97              0.8305

0.8356 2.1612     85              98              0.8406

0.8356 2.6706     85              99              0.8490

1.0273 0.8878     90              85              0.7890

1.0273 1.0151     90              90              0.8092

1.0273 1.5245     90              95              0.8633

1.0273 1.7792     90              97              0.8765

1.0273 2.1612     90              98              0.8866

1.0273 2.6706     90              99              0.8949

1.4106 0.8878     95              85              0.8403

1.4106 1.0151     95              90              0.8613

1.4106 1.5245     95              95              0.9171

1.4106 1.7792     95              97              0.9305

1.4106 2.1612     95              98              0.9409

5.2.2 多模型对比 

除了互相关分析,我们还采用了差分响应分析法来进一步验证延迟的估计结果。该方法通过分析输入信号的显著变化,并观察输出信号的响应,来估计延迟。具体地,首先对输入信号进行差分处理,计算输入信号的变化幅度(即每个时刻与前一时刻的差值)。然后,设置一个阈值,识别输入信号中大于该阈值的显著变化点,这些变化点被认为是输入信号的脉冲。

通过选择显著变化点(脉冲点),我们分析对应的输出响应。在每个脉冲点之后,我们计算输出信号的变化,并通过与基线(脉冲点前的输出值的均值)进行比较,确定响应达到最大值时的延迟。具体来说,我们通过以下步骤来计算延迟:

1.计算输入信号的差分:

2.选择差分超过某个阈值的变化点作为显著变化点。
3.对于每个显著变化点,记录输出信号的响应,计算其与基线的差异。
4.找到响应的最大变化位置,并将其作为延迟估计。
对于每个输入信号,我们选择了 5 个以上的显著变化点,并确保它们之间有足够的间隔(至少 50 个时间单位)。对于每个选定的脉冲点,我们计算输出信号的最大响应,并将这些响应时间作为延迟估计的候选值。如果选定的延迟值超过了 3 个有效值,我们取这些延迟的中位数作为最终的延迟估计结果。

在互相关分析法和差分响应法的基础上,我们结合两种方法的结果来得到更为可靠的延迟估计。为了合并两种方法的结果,我们给每种方法分配了不同的权重,通常互相关分析法的权重较大,脉冲响应法的权重较小。综合延迟估计可以通过加权平均计算得到:

其中,
 和
 是互相关法和脉冲响应法的权重,通常
 。通过这种加权方式,我们得到了每个输入信号对
 和
 的综合响应延迟估计。

综合延时估计结果:

输入变量 输出变量       互相关法延时          脉冲响应法延时         综合估计延时         

---------------------------------------------------------------------------------

IN1 OUT1       0               144             43             

IN1 OUT2       0               129             39             

IN2 OUT1       4                           

IN2 OUT2       40              121             64             

IN3 OUT1       25                         

IN3 OUT2       0               126             38             

IN4 OUT1       10              128             45           

http://www.xdnf.cn/news/6793.html

相关文章:

  • Vue3:脚手架
  • 一分钟了解Python编程语言
  • 科技项目验收测试对软件产品和企业分别有哪些好处?
  • 机器学习知识自然语言处理入门
  • allure报告自定义logo和名称
  • 什么是SMBus
  • 医疗机械中丝杆支撑座有什么特殊要求?
  • 前端精度问题全解析:用“挖掘机”快速“填平精度坑”的完美解决方案
  • 支付宝授权登录
  • ROS2学习(4)------ROS2工作空间介绍
  • Vue3基础学习(中)
  • 高标准农田灌区信息化赋能粮食产能提升
  • 二维数组以及C99中的变长数组(如何在VS2022中使用苹果的clang编译器)
  • 智慧灌区信息化节水灌溉系统解决方案
  • 基于 nvitop+Prometheus+Grafana 的物理资源与 VLLM 引擎服务监控方案
  • 【Python】EAFP?请求原谅比请求允许容易?
  • 小白学编程之——深入理解Java线程的完整生命周期
  • 研华服务器ASMB-825主板无法识别PCIE-USB卡(笔记本)
  • 5.10品牌日|电商院徐一帆解读:中国企业如何迈向全球品牌
  • 根据用户ID获取所有子节点数据或是上级直属节点数据
  • DiT中的 Adaptive Layer Normalization (adaLN) 讲解
  • 代码随想录算法训练营 Day48 单调栈Ⅱ 接雨水Like
  • 第三十三节:特征检测与描述-Shi-Tomasi 角点检测
  • 【记录】Windows|竖屏怎么调整分辨率使横竖双屏互动鼠标丝滑
  • 基于matlab的D2D 功率控制仿真
  • 【Boost搜索引擎】构建Boost站内搜索引擎实践
  • Tor推出Oniux新工具:为Linux应用提供网络流量匿名化
  • 将 Element UI 表格元素导出为 Excel 文件(处理了多级表头和固定列导出的问题)
  • DAY 28 类的定义
  • 安全生产调度管理系统的核心功能模块