当前位置: 首页 > ops >正文

基于贝叶斯网络构建结构方程_TomatoSCI分析日记

        上一篇我们了解了高斯型贝叶斯网络,今天聊它的实际应用——结构方程模型(SEM)。

        SEM构建时常见难题是:变量间路径如何确定?没有清晰理论假设,盲设路径容易误导。高斯贝叶斯网络能自动从数据中挖掘潜在路径,给SEM建模提供数据驱动的依据。

流程两步走:

➤ 先用贝叶斯网络探索路径结构

➤ 基于路径构建SEM,拟合评估模型


01 通过贝叶斯网络寻找路径

图1是部分数据展示,要求都要为连续变量,不能太少,当变量多而数据量少的时候,拟合的效果很差。

图2是贝叶斯网络,因为只利用它寻找路径,因此忽略系数。

图3是路径的文字表达,是接下来构建结构方程的主角。


02 结构方程拟合

图4是结构方程的可视化:

✦单向实线箭头指的是因果关系,谁影响谁,双向实线箭头是相关关系,双向虚线箭头是残差相关。

✦使用最大似然估计(ML)法估计来估算每个路径的系数,重点看变量的显著性和系数的正负号(判断正向影响和负向影响)。

✦残差相关其实就是模型未能解释的那部分之间的关系。就是即使我们建立了模型,还是有些变量之间存在着我们没能捕捉到的某些关联,这些关联表现在残差之间。

✦这是R的原始出图,非常粗糙,这里只介绍方法,美化就暂时先不做了。

图5是结构方程拟合指标等结果:

✦P-value(Chi-square)大于0.05模型表示无显著偏差,CFI和TLI大于0.95为佳(图5A);

✦SEMR小于0.05为佳(图5B);

✦图5C的“~”匹配图中单向实线箭头的路径,表因果关系,p值小于0.05表示路径显著,系数关注正负,看正负影响;

✦图5D的“~~”匹配图中的双向实线箭头,p值和系数的理解同图5C;R方反映的是模型对因变量变化的解释程度。R²越大,说明模型越能解释因变量的变化,比如R方=0.8,意味着模型可以解释80%的因变量变化,剩下的20%是模型未能捕捉到。


03 结语

        该方法优势在于,无需指定路径,对于变量间因果路径复杂的研究问题尤为适用。有潜变量的数据不适用于该方法,因为贝叶斯网络要求所有变量均为显变量。

        还有一个点要避免的是,贝叶斯网络中箭头的系数只是两者之间的系数,而结构方程中箭头的系数是考虑了所有变量的系数,个人认为贝叶斯网络中的路径作为一个中间结果,我们只需关注其中变量的路径关系,系数可以不纳入分析。


        TomatoSCI科研数据分析平台,欢迎大家来访!数据分析无需登录,专业在线客服答疑,还可在线传输文件,五折优惠码“tomatosci”开放使用中。PCA、RDA、PCoA、Lasso回归等方法等你就位。

http://www.xdnf.cn/news/12692.html

相关文章:

  • Qwen系列之Qwen3解读:最强开源模型的细节拆解
  • 计数排序_桶排序
  • 从 Vue 2.0 进阶到 Vue 3.0 的核心技术解析指南
  • **解锁 C++ std::map 的力量**
  • android 布局小知识点 随记
  • OpenEuler服务器警告邮件自动化发送:原理、配置与安全实践
  • 数据的输出、输入
  • 20242817李臻-安全文件传输系统-项目验收
  • springboot2.x升级springboot3.x
  • 端午编程小游戏--艾草驱邪
  • 【SpringBoot自动化部署方法】
  • UDP与TCP通信协议技术解析
  • XXL-JOB——源码分析解读(1)
  • 英语词汇表格 form, table, sheet, grid, tabulation 的区别
  • 打卡第38天:早停策略和模型权重的保存
  • Maven的配置与运行
  • 【强化学习】——04Model-Based RL
  • 垃圾回收相关八股
  • IDEA中的debug使用技巧
  • 伽罗华域GF(galois field)的乘法计算 - 查表法
  • Three.js实现梦幻星光漩涡特效 - 从原理到实现
  • Python 基础核心语法:输入输出、变量、注释与字符串操作
  • FirmAE安装-重新写
  • JDK17安装与配置
  • 心理咨询技能竞赛流程方案
  • Python Day45
  • 业余无线电FT8信道调制之LDPC编码
  • EMD算法
  • 复变函数极限介绍与MATLAB演示
  • 【仿生机器人】仿生机器人智能架构:从感知到个性的完整设计