本项目链接 MTCNN论文链接 https://github.com/PerformapalSolv/CV_FaceDetection_PytorchMTCNN_demo

人脸检测小作业

[TOC]

项目使用：直接使用Pytorch-MTCNN-Mychange/Pytorch-MTCNN-Origin中已经训练好的模型

在文件夹下运行:

python infer_camera.py
或：
infer_path.py

如需自行训练模型:

下载dataset文件夹：链接：https://pan.baidu.com/s/1ClZdE-9XK1rZ4YFSJgkpfg?pwd=ltks 提取码：ltks

接着:

cd dataset
python ChangeDataset.py   
cd train_PNet 切换到train_PNet文件夹

python3 generate_PNet_data.py 首先需要生成PNet模型训练所需要的图像数据

python3 train_PNet.py 开始训练PNet模型

cd train_RNet 切换到train_RNet文件夹

python3 generate_RNet_data.py 使用上一步训练好的PNet模型生成RNet训练所需的图像数据

python3 train_RNet.py 开始训练RNet模型

cd train_ONet 切换到train_ONet文件夹

python3 generate_ONet_data.py 使用上两部步训练好的PNet模型和RNet模型生成ONet训练所需的图像数据

python3 train_ONet.py 开始训练ONet模型

Opencv级联分类器

OpenCV级联分类器的原理主要基于Viola和Jones在2001年提出的一种高效的特征检测方法。它通过使用一系列简单的特征来检测目标对象,并利用AdaBoost算法训练出一个强分类器。该方法主要包括以下几个关键步骤:

积分图像(Integral Image) 为了快速计算图像的任意矩形区域的像素值之和,引入了积分图像的概念。积分图像可以通过简单的递推关系式快速生成。

Haar-like特征 使用Haar-like特征来描述目标对象的特征,这些矩形特征通过加权求和计算得到。Haar-like特征对于垂直、水平和对角边缘等较为敏感。

AdaBoost算法 AdaBoost算法用于从大量的Haar-like特征中选择一小部分有效特征,并将这些弱分类器线性组合成一个强分类器。每个弱分类器根据单个特征的分类结果赋予加权系数。

级联结构 为了提高检测速度,在训练时构建一个由多个加权强分类器构成的级联结构。待检测的窗口区域必须通过所有级别的分类器才能被判定为目标对象。大部分负样本在初级阶段就会被剔除,从而加快了检测速度。

滑动窗口检测 利用滑动窗口的方式在图像上进行目标检测。窗口在图像四周和不同尺度扫描,对每个窗口区域利用级联分类器进行分类。总的来说,级联分类器通过简单高效的特征、AdaBoost训练和级联结构,实现了快速且可靠的目标检测。它广泛应用于人脸、行人、车辆等目标的实时检测领域。

在下载Opencv-python包时，级联分类器模型已经自动下载

C:/anaconda3/envs/pytorch/Lib/site-packages/cv2/data/haarcascade_frontalface_alt2.xml

如以下代码:

#导入cv模块
import cv2 as cv
#检测函数
def face_detect_demo():
    gary = cv.cvtColor(img,cv.COLOR_BGR2GRAY)
    face_detect = cv.CascadeClassifier('C:/anaconda3/envs/pytorch/Lib/site-packages/cv2/data/haarcascade_frontalface_alt2.xml')
    face = face_detect.detectMultiScale(gary,1.01,5,0,(100,100),(300,300))
    for x,y,w,h in face:
        cv.rectangle(img,(x,y),(x+w,y+h),color=(0,0,255),thickness=2)
    cv.imshow('result',img)

#读取图像
img = cv.imread('test.jpg')
#检测函数
face_detect_demo()
#等待
while True:
    if ord('q') == cv.waitKey(0):
        break
#释放内存
cv.destroyAllWindows()

Pytorch-MTCNN-Origin：直接使用MTCNN的训练过程

最大的困难在于数据集的选择，我选择Deep Convolutional Network Cascade for Facial Point Detection 人脸关键点数据集、WIDER Face人脸数据集

这两个都是相当大的数据集，直接训练不可行，所以要对数据集再进行选择。最终，得到可以训练的数据集。

原项目作者对WIDER_FACE集数据集进行精简，已经得到了12000张图片的数据集——但在此基础上，以我当前算力还是很耗费时间——对此，我进行进一步裁剪，只取其中人脸数<=2的图片，最后得到约6820张图片，实验得以进行，并最终浮现训练过程，训练出自己的模型

MTCNN网络：

论文链接

配置：2*P100-PCIE-16GB

Pnet

generate_Pnet_data

train_Pnet

一共训练30个周期，每次384个批次，学习率为1e-3

Rnet

Generate_Rnet

Train_Rnet

batch_size = 384
learning_rate = 1e-3
epoch_num = 22

Onet

Generate_Onet

train_Onet

实验结果：

Pytorch-MTCNN-Mychange:对网络进行修改，删除Landmask部分，简化模型

为了简化实验代码，调整网络结构，删去PNet/RNet/ONet中的Landmask部分，减少关键点训练的部分

performapalsolv / cv_facedetection_pytorchmtcnn_demo Goto Github PK

cv_facedetection_pytorchmtcnn_demo's Introduction

人脸检测小作业

Opencv级联分类器

Pytorch-MTCNN-Origin：直接使用MTCNN的训练过程

Pnet

generate_Pnet_data

train_Pnet

Rnet

Generate_Rnet

Train_Rnet

Onet

Generate_Onet

train_Onet

实验结果：

Pytorch-MTCNN-Mychange:对网络进行修改，删除Landmask部分，简化模型

Pnet

Generate_Pnet_data

Train_Pnet

RNet

Generate_Rnet_data

Train_Rnet

ONet

Generate_Onet_data

Train_Onet

模型效果

Inspiration

cv_facedetection_pytorchmtcnn_demo's People

Contributors

Stargazers

Watchers

Recommend Projects

Recommend Topics

Recommend Org

Jobs