当前位置：首页 > ds >正文

使用OpenCV和dlib库进行人脸关键点定位

ds 2025/7/2 13:51:15

文章目录

引言
一、环境准备
二、代码实现解析
- 1. 导入必要的库
- 2. 加载图像和人脸检测器
- 3. 加载关键点预测模型
- 4. 检测并绘制关键点
- 5. 显示结果
三、68个关键点的含义
四、常见问题解决
五、总结

引言

人脸关键点定位是计算机视觉中的一项基础任务，它在人脸识别、表情分析、虚拟化妆等应用中发挥着重要作用。本文将介绍如何使用dlib库来实现精准的人脸关键点检测。

一、环境准备

在开始之前，我们需要安装必要的Python库：

pip install numpy opencv-python dlib

此外，还需要下载dlib的预训练模型文件：

shape_predictor_68_face_landmarks.dat - 包含68个人脸关键点的预测模型

二、代码实现解析

让我们逐步分析人脸关键点检测的完整代码：

1. 导入必要的库

import numpy as np
import cv2
import dlib

numpy ：用于数值计算
cv2 ：OpenCV库，用于图像处理
dlib ：强大的机器学习库，包含现成的人脸检测和关键点定位模型

2. 加载图像和人脸检测器

img = cv2.imread("face.png")
detector = dlib.get_frontal_face_detector() # 构造人脸检测器
faces = detector(img, 0) # 检测人脸

get_frontal_face_detector() 返回一个基于HOG特征和线性分类器的人脸检测器，detector() 方法返回检测到的人脸矩形框列表。

3. 加载关键点预测模型

predictor = dlib.shape_predictor("shape_predictor_68_face_landmarks.dat")

shape_predictor 是dlib提供的预训练模型，能够检测人脸的68个关键点，包括眼睛、眉毛、鼻子、嘴巴和脸部轮廓。

4. 检测并绘制关键点

for face in faces:   # 遍历每张检测到的人脸shape = predictor(img, face)  # 获取关键点landmarks = np.array([[p.x, p.y] for p in shape.parts()])  # 转换为坐标数组# 绘制关键点和编号for idx, point in enumerate(landmarks):pos = (point[0], point[1])  # 当前关键点的坐标cv2.circle(img, pos, 2, color=(0, 255, 0), thickness=-1)  # 绘制实心圆cv2.putText(img, str(idx), pos, cv2.FONT_HERSHEY_SIMPLEX, 0.4,(255, 255, 255), 1, cv2.LINE_AA)  # 标注关键点编号

5. 显示结果

cv2.imshow("img", img)
cv2.waitKey()
cv2.destroyAllWindows()

结果运行如下：
在这里插入图片描述

三、68个关键点的含义

dlib的68点模型将人脸关键点分为以下几个区域：

0-16点：下巴轮廓
17-21点：右眉毛
22-26点：左眉毛
27-35点：鼻子
36-41点：右眼
42-47点：左眼
48-67点：嘴巴

了解这些点的分布有助于后续的面部特征分析和处理。

四、常见问题解决

检测不到人脸：
- 确保人脸在图像中足够大
- 尝试调整 detector() 的第二个参数（上采样次数）
关键点不准确：
- 检查图像质量（光照、模糊度等）
- 尝试使用更高精度的模型
模型加载失败：
- 检查模型文件路径是否正确
- 确保下载的模型文件完整

五、总结

dlib提供了一个简单而强大的人脸关键点检测解决方案。通过本文介绍的方法，你可以快速实现精准的人脸特征点定位，为后续的人脸分析应用奠定基础。虽然深度学习-based的方法在某些场景下可能更准确，但dlib的解决方案在速度和易用性方面仍有很大优势。

查看全文

http://www.xdnf.cn/news/2751.html

2025系统架构师---管道/过滤器架构风格

待验证---Oracle 19c 在 CentOS 7 上的快速安装部署指南

Java生成微信小程序码及小程序短链接

TensorFlow深度学习框架：从入门到精通的完整指南

基于Java，SSH，Vue电子商品交易二手平台仿闲鱼转转验机系统设计

Eureka 深度解析：从原理到部署的全场景实践

喷泉码技术在现代物联网中的应用设计

组装 (DIY) 一台显示器 (4K 屏支持 4 画面分屏 PBP 1080p x4)

前端基础面试题（4-8）

推荐 1 款 9.3k stars 的全景式开源数据分析与可视化工具

Python爬虫（9）Python数据存储实战：基于pymysql的MySQL数据库操作详解

疫苗接种体系进入“全生命周期”时代：公共卫生治理再提速

学习记录：DAY19

AI在Java中的场景面试题深度解析

从外卖大战看O2O新趋势：上门私厨平台系统架构设计解析

kalibr：相机模型

8.Three.js中的 StereoCamera 立体相机详解+示例代码

第十三章-PHP MySQL扩展

处理对象集合，输出Map＜String, Map＜String, List＜MyObject＞＞＞格式数据，无序组合键处理方法

Android学习总结之Java篇（一）

记一次pdf转Word的技术经历

Mioty｜采用报文分割（Telegram Splitting）以提高抗干扰能力的无线通信技术

elasticsearch底层模块解析与实践系列

基于大模型的胆总管结石全流程预测与临床应用研究报告

基于 SpringBoot 与 Redis 的缓存预热案例

【计算机视觉】CV实战项目-高分辨率遥感图像语义分割：High-Resolution-Remote-Sensing-Semantic-Segmentation

《Vue3学习手记6》

人工智能期末复习1

Java8 后接口的用法总结

「Mac畅玩AIGC与多模态04」开发篇01 - 创建第一个 LLM 对话应用