当前位置: 首页 > java >正文

使用OpenCV 和 Dlib 实现疲劳检测

文章目录

  • 引言
  • 1.相关技术介绍
  • 2. 系统原理
    • 2.1 眼睛纵横比(EAR)算法
    • 2.2 系统工作流程
  • 3.代码解析
    • 3.1 关键函数说明
    • 3.2 主循环逻辑
  • 4.实际应用效果
  • 5.参数调优建议
  • 6.总结

引言

疲劳驾驶是交通事故的主要原因之一。本文将介绍如何使用Python和计算机视觉技术构建一个实时疲劳驾驶检测系统,该系统通过分析驾驶员眼睛状态来判断疲劳程度。这个项目结合了人脸关键点检测、几何计算和状态机逻辑,是一个典型的计算机视觉应用案例。

1.相关技术介绍

  • Dlib:用于人脸检测和68个关键点定位
  • OpenCV:视频流处理和图像显示
  • Scikit-learn:用于计算欧氏距离
  • Pillow:支持在图像上添加中文文本

2. 系统原理

2.1 眼睛纵横比(EAR)算法

核心算法是计算眼睛的纵横比(Eye Aspect Ratio),公式如下:

EAR = (|p1-p5| + |p2-p4|) / (2 * |p0-p3|)

其中p1-p6是眼睛周围的6个关键点:

                       p1    p2p0               p3   <------这是眼睛的6个关键点p5    p4

当眼睛睁开时,EAR值较高;闭眼时,EAR值接近0。

2.2 系统工作流程

  1. 通过摄像头捕获视频帧
  2. 使用Dlib检测人脸和眼睛关键点
  3. 计算左右眼的EAR值并取平均
  4. 根据EAR阈值判断眼睛状态
  5. 持续闭眼超过阈值帧数则触发警报

3.代码解析

3.1 关键函数说明

眼睛纵横比计算

def eye_aspect_ratio(eye):A = euclidean_distances(eye[1].reshape(1,2), eye[5].reshape(1,2))B = euclidean_distances(eye[2].reshape(1,2), eye[4].reshape(1,2))C = euclidean_distances(eye[0].reshape(1,2), eye[3].reshape(1,2))return ((A + B) / 2.0) / C
  • A:计算点1和点5之间的欧几里得距离(垂直距离1)
  • B:计算点2和点4之间的欧几里得距离(垂直距离2)
  • C:计算点0和点3之间的欧几里得距离(水平距离)
  • EAR = ((A + B)/2.0)/C:这个公式计算的是眼睛的"高度"(垂直距离的平均值)与"宽度"(水平距离)的比值。

中文文本显示

def cv2AddChineseText(img, text, position, textColor=(0,255,0), textSize=30):"""向图片中添加中文"""if (isinstance(img,np.ndarray)):   # 判断是否OpenCV图片类型img = Image.fromarray(cv2.cvtColor(img,cv2.COLOR_BGR2RGB))  # 实现array到image的转换draw = ImageDraw.Draw(img) # 在img图片上创建一个绘图的对象# 字体的格式fontStyle = ImageFont.truetype("simsun.ttc",textSize,encoding="utf-8")draw.text(position,text,textColor,font=fontStyle) # 绘制文本return cv2.cvtColor(np.asarray(img),cv2.COLOR_BGR2RGB) # 转换回OpenCV格式

眼睛轮廓绘制

def drawEye(eye):eyeHull = cv2.convexHull(eye)cv2.drawContours(frame, [eyeHull], -1, (0,255,0), -1)

3.2 主循环逻辑

while True:# 读取视频帧# 人脸检测和关键点定位rightEye = shape[36:42]  # 右眼关键点leftEye = shape[42:48]  # 左眼关键点# 计算EAR值ear = (leftEAR + rightEAR) / 2.0# 疲劳判断逻辑if ear < 0.4:COUNTER += 1if COUNTER >= 30:  # 持续闭眼30帧# 显示警告else:COUNTER = 0  # 重置计数器

4.实际应用效果

系统运行时会在视频中:

  1. 用绿色区域标记眼睛轮廓
  2. 实时显示当前EAR值
  3. 当检测到持续闭眼时显示"危险"警告

显示效果如下:

在这里插入图片描述

5.参数调优建议

  1. EAR阈值:0.4是经验值,可根据实际场景调整
    调高:系统更敏感,容易误报

    • 调低:系统更保守,可能漏报
  2. 连续帧数阈值:30帧(约1秒)

    • 可根据实际需求调整疲劳判定时间
  3. 性能优化

    • 可降低视频分辨率提高处理速度
    • 使用多线程处理视频流

6.总结

本文介绍了一个基于Dlib和OpenCV的实时疲劳检测系统。该系统通过计算眼睛纵横比来判定驾驶员状态,具有以下特点:

  1. 实时性:可在普通电脑上实时运行
  2. 准确性:基于几何特征而非颜色特征,适应不同光照条件
  3. 可扩展性:框架可轻松扩展到其他行为检测

完整代码已在上文中提供,读者可以自行尝试实现或在此基础上进行二次开发。这个项目不仅具有实用价值,也是学习计算机视觉和人脸分析的优秀案例。

理想的风会吹进现实,熬过的夜也会变成光!我们一起努力,顶峰相见!🚀🚀🚀

http://www.xdnf.cn/news/3961.html

相关文章:

  • 【macOS常用快捷键】
  • Flink流水线任务在线演示
  • C++类和对象之默认成员函数
  • 基于 Spark 和 Hadoop 的空气质量数据分析与预测系统
  • 【AI提示词】AARRR 模型执行者
  • Google-chrome版本升级后sogou输入法不工作了
  • Cisco NDO - Nexus Dashboard Orchestrator
  • 202533 | SpringBoot集成RocketMQ
  • 2025 年 408 真题及答案
  • 深入探索Anthropic Claude与Spring AI的融合应用
  • 虚幻引擎5-Unreal Engine笔记之显卡环境设置使开发流畅
  • 【LaTeX+VSCode本地Win11编译教程】
  • Debezium TableSchemaBuilder详解
  • (一)Modular Monolith Architecture(项目结构/.net项目初始化/垂直切片架构)
  • 洛谷 P1440 求m区间内的最小值
  • 8.5/Q1,Charls高分经典文章解读
  • 【Web3】上市公司利用RWA模式融资和促进业务发展案例
  • Spring Boot多模块划分设计
  • C++访问MySQL
  • 《Python星球日记》第31天:Django 框架入门
  • opencv+opencv_contrib+cuda和VS2022编译
  • 202531 | RocketMQ 消息过滤 + 消息重试机制 + 死信消息 + 重复消费问题
  • zotero pdf中英翻译插件使用
  • epub格式转txt格式工具,txt批量转PDF
  • 设计模式(结构型)-组合模式
  • 【Java ee初阶】多线程(6)
  • item_get_app_pro - 获得淘宝app商品详情原数据操作流程
  • 使用 vllm 部署 Llama3-8b-Instruct
  • 【C++】grpc(一):安装
  • 【Python】Python好玩的第三方库之二维码生成,操作xlsx文件,以及音频控制器