当前位置: 首页 > news >正文

基于深度学习的人类活动识别模型研究:HAR-DeepConvLG的设计与应用

一、引言 (Introduction)

  • 研究背景:随着物联网(IoT)技术的发展,人类活动识别(HAR)在多个领域变得日益重要。智能手机和可穿戴设备内置的传感器可以收集多变量时间序列数据,用于识别人类活动。

  • 研究意义:HAR在人机交互、步态分析、家庭行为分析等领域有广泛应用。深度学习(DL)和机器学习(ML)技术提高了HAR的性能。

二、背景

构建HAR-DeepConvLG模型所依赖的几种深度学习技术,包括卷积神经网络(CNN)、挤压和激励块(SE块)、长短期记忆网络(LSTM)和门控循环单元(GRU)。这些技术是构建有效HAR系统的关键组成部分。

2.1 CNN模型
  • CNN结构:CNN是一种前馈神经网络,通过卷积操作提取数据特征。它由多种层组成,包括卷积层、池化层、密集(全连接)层和展平层。

  • 特征提取:CNN使用滤波器(或称为核或特征检测器)通过卷积函数提取信息。在CNN中,初始卷积层用于获取基本特征(如边缘和颜色),而后面的层用于捕获更复杂的数据特征,以识别所需对象。

2.2 SE块
  • SE块结构:SE块是CNN中的一个架构元素,通过添加到CNN中来提高性能,同时只略微增加参数总量。

  • 工作流程:SE块通过挤压操作将全局空间信息转换为标量通道描述符,然后通过激励操作捕获通道间的依赖性,最后通过通道间乘法来重新校准特征图。

2.3 LSTM模型
  • LSTM单元:LSTM单元是一种特别设计的计算单元,有效解决了梯度消失问题,增强了循环神经网络在需要长期记忆保持的场景中的实用性。

  • 门控机制:LSTM通过引入遗忘门、输入门和输出门来控制信息的流动,从而管理当前输出对先前输入的依赖性。

2.4 GRU块
  • GRU结构:GRU是LSTM的一个简化版本,它将输入门和遗忘门合并为一个更新门,没有单独的细胞状态,因此在结构上更简单,参数更少。

  • 性能优势:由于GRU的结构更简单,它在性能和收敛速度上通常优于LSTM

三、提出的DL模型

本节详细介绍了论文中提出的深度学习模型HAR-DeepConvLG,该模型旨在通过结合卷积层、SE块、LSTM和GRU来解决物联网应用中的人类活动识别(HAR)问题。

3.1 空间特征提取
  • CNN层:模型使用三个卷积层来提取时间序列输入数据的空间特征。每个卷积层后面跟着一个SE块、批量归一化层、ReLU激活函数和最大池化层(大小为2)。

  • SE块的集成:在最终的卷积块之后,再使用一个SE块来更准确地学习和提取输入时间序列序列的空间特征。

  • 滤波器和核大小:第一层卷积层使用3的核大小和64的滤波器大小,接下来的两层分别增加到128和7的滤波器和核大小。

3.2 时间特征融合
  • 并行路径:模型采用三个并行路径,每个路径包含一个LSTM层(64个单元)和一个GRU层(16个单元),以学习时间特征。

  • 避免梯度消失:这些路径并行连接,以防止在训练神经网络时出现的梯度消失问题。

3.3 识别块结构
  • 展平与转换:RB首先将时间学习融合的输出展平,然后转换为一维向量,作为全连接层和softmax层的输入。

  • 全连接层:全连接层包含32个神经元,并跟随着一个dropout层以避免过拟合问题。

  • Softmax层:使用softmax激活函数来预测最终的人类活动,计算概率分数以确定当前实例是否属于特定类别。

3.4 模型流程图
  • 模型架构:模型通过有效整合CNN、LSTM和GRU来实现更好的分类准确性。

  • 优化器和损失函数:使用Adam优化器来最小化损失函数(分类交叉熵,CCE),以优化模型权重。

  • 学习率调整:学习率从0.001线性降低到0.0001,以逐步减小用于更新模型参数的步长,以改善最终分类性能。

四、实验结果

4.1实验结果分析
  • UCI-HAR数据集:HAR-DeepConvLG模型在该数据集上达到了97.52%的分类准确率,优于其他比较的模型。

  • WISDM数据集:模型在该数据集上达到了98.48%的分类准确率,同样优于其他模型。

  • USC-HAD数据集:模型在该数据集上达到了97.85%的分类准确率,显示出模型的高性能。

  • PAMP2数据集:模型在该数据集上达到了98.55%的分类准确率,进一步验证了模型的有效性。

4.2结果讨论
  • 模型性能:实验结果表明,HAR-DeepConvLG模型在所有测试的数据集上都展现出了优越的性能,这证明了模型在提取空间和时间特征方面的有效性。

  • 计算成本:尽管模型在性能上表现出色,但由于使用了大量可训练参数,模型的计算成本相对较高。

这个模型巧妙地将深度学习中的几个强大工具——卷积层、SE块、LSTM和GRU——结合起来,用于识别人类活动,这让我觉得特别酷。它不仅提高了识别的准确性,还通过并行路径解决了梯度消失的问题,这对于深度学习模型来说是个常见的难题。

我对这个模型能够处理多变量时间序列数据并且准确提取空间和时间特征的能力印象深刻。这种能力让它在物联网应用中特别有用,比如智能家居和健康监测。实验结果也证明了它的有效性,它在不同的数据集上都取得了很好的性能。

http://www.xdnf.cn/news/1040977.html

相关文章:

  • 【大厂机试题解法笔记】恢复数字序列
  • Python开发功能实用
  • 关于钉钉的三方登录
  • 项目管理工具在并行管理中如何充分发挥作用
  • Python 使用 DrissionPage 模块进行爬虫
  • 【Linux网络】多路转接之select
  • windows 开发
  • JavaScript性能优化实战指南:从理论到案例的全面解析
  • 【医疗电子技术-7.2】血糖监测技术
  • 高效同步Linux服务器文件技巧
  • Spring Bean 生命周期:注册、初始化、注入及后置操作执行顺序
  • 湖北理元理律师事务所债务规划方法论:法律框架下的可持续还款体系
  • Java反射机制深度解析
  • 微信小程序实现文字逐行动画效果渲染显示
  • 《Origin画百图》之核密度图
  • JAVA中关于Animal和Dog类的类型转换,可能出现ClassCastException的情况
  • AndroidMJ-mvp与mvvm
  • 贪心算法经典问题
  • 思科交换机远程登录配置
  • XCTF-misc-Test-flag-please-ignore
  • Trino权威指南
  • DP刷题练习(一)
  • Java内存模型与垃圾回收:提升程序性能与稳定性!
  • 戴维南端接与 RC端接
  • 源码开发详解:搭建类似抖音小店的直播带货APP需要掌握哪些技术?
  • Codeforces Round 1030 (Div. 2)
  • OpenVINO使用教程--resnet分类模型部署
  • QCombobox设置圆角下拉列表并调整下拉列表位置
  • EffRes-DrowsyNet:结合 EfficientNetB0 与 ResNet50 的新型混合深度学习模型用于驾驶员疲劳检测算法实现
  • 网络安全防护:Session攻击