人脸识别的简单介绍(含Python代码)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

人脸识别的简单介绍(含Python代码)介绍你是否意识到,每当你上传照片到Facebook上,平台都会用人脸识别算法来识别图片中的人物?目前还有一些政府在用人脸识别技术来识别和抓捕罪犯。此外,最常见的应用就是通过自己的脸部解锁手机。计算机视觉的子领域应用得非常广泛,并且全球很多商业活动都已经从中获益。人脸识别模型的使用在接下来的几年内还会继续增长,所以一起来了解如何从零开始构建人脸识别模型吧!本文首先会介绍人脸识别模型的内部工作原理。随后结合一个简单的案例,我们将通过Python进行案例实践。在本文的最后部分,你将完成你的第一个人脸识别模型!目录理解人脸识别的工作原理案例学习Python应用理解Python代码人脸识别算法的应用理解人脸识别的工作原理为了理解人脸识别算法工作原理,我们首先来了解一下特征向量的概念。(译者注:此处的特征向量指机器学习的概念,不同于矩阵理论。)每个机器学习算法都会将数据集作为输入,并从中学习经验。算法会遍历数据并识别数据中的模式。例如,假定我们希望识别指定图片中人物的脸,很多物体是可以看作模式的:脸部的长度/宽度。由于图片比例会被调整,长度和高度可能并不可靠。然而,在放缩图片后,比例是保持不变的——脸部长度和宽度的比例不会改变。脸部肤色。脸上局部细节的宽度,如嘴,鼻子等。显而易见,此时存在一个模式——不同的脸有不同的维度,相似的脸有相似的维度。有挑战性的是需要将特定的脸转为数字,因为机器学习算法只能理解数字。表示一张脸的数字(或训练集中的一个元素)可以称为特征向量。一个特征向量包括特定顺序的各种数字。举一个简单的例子,我们可以将一张脸映射到一个特征向量上。特征向量由不同的特征组成,如:脸的长度(cm)脸的宽度(cm)脸的平均肤色(R,G,B)唇部宽度(cm)鼻子长度(cm)当给定一个图片时,我们可以标注不同的特征并将其转化为如下的特征向量:如此一来,我们的图片现在被转化为一个向量,可以表示为(23.1,15.8,255,224,189,5.2,4.4)。当然我们还可以从图片中衍生出无数的其他特征(如,头发颜色,胡须,眼镜等)。然而在这个简单的例子中,我们只考虑这五个简单的特征。现在,一旦我们将每个图片解码为特征向量,问题就变得更简单。明显地,当我们使用同一个人的两张面部图片时,提取的特征向量会非常相似。换言之,两个特征向量的“距离”就变得非常小。此时机器学习可以帮我们完成两件事:提取特征向量。由于特征过多,手动列出所有特征是非常困难的。一个机器学习算法可以自动标注很多特征。例如,一个复杂的特征可能是:鼻子长度和前额宽度的比例。手动列出所有的这些衍生特征是非常困难的.匹配算法:一旦得到特征向量,机器学习算法需要将新图片和语料库中的特征向量进行匹配。既然我们对人脸识别如何工作有了基本的理解,让我们运用一些广泛使用的Python库来搭建自己的人脸识别算法。案例学习首先给定一些人物脸部的图片——可能是一些名人,如MarkZuckerberg,WarrenBuffett,BillGates,ShahRukhKhan等,并把这些人脸看作我们的语料库。现在,我们给定一些其他名人的新图片(“新人物”),并判断这些“新人物”是否在语料库中。以下是语料库中的图片:如图所示,我们所列举的名人有BarackObama,BillGates,JeffBezos,MarkZuckerberg,RayDalio和ShahRukhKhan。现在,假定“新人物”如下:显而易见,这是ShahRukhKhan。然而对电脑来说,这个任务很有挑战性。因为对于我们来说,我们可以轻易地将图片的多种特征结合来判断这是哪个人物。然而对电脑而言,学习如何识别人脸是非常不直观的。有一个神奇但是简单的python库封装了以上提及的内容——可以根据脸部特征生成特征向量并且知道如何区分不同的脸。这个python库叫做face_recognition。它应用了dlib——一个现代C++工具包,其中包含了一些机器学习算法来帮助完成复杂的基于C++的应用。Python中的face_recognition库可以完成大量的任务:发现给定图片中所有的脸。发现并处理图片中的脸部特征。识别图片中的脸。实时的人脸识别。接下来,我们将探讨其中的第三种任务——识别图片中的脸。你可以在github的如下链接中获取face_recognition库的源代码。附链接:事实上,这里有一些如何安装face_recognition库的指导。附链接:在你安装face_recognition之前,还需要安装dlib包。你可以从如下链接中找到安装dlib的指导.附链接:应用这部分包括使用face_recognition库搭建简单人脸识别系统的代码。这是一个应用操作的部分,我们将在下一部分解读代码来理解更多细节。#importthelibrariesimportosimportface_recognition#makealistofalltheavailableimagesimages=os.listdir('images')#loadyourimageimage_to_be_matched=face_recognition.load_image_file('my_image.jpg')#encodedtheloadedimageintoafeaturevectorimage_to_be_matched_encoded=face_recognition.face_encodings(image_to_be_matched)[0]#iterateovereachimageforimageinimages:#loadtheimagecurrent_image=face_recognition.load_image_file(images/+image)#encodetheloadedimageintoafeaturevectorcurrent_image_encoded=face_recognition.face_encodings(current_image)[0]#matchyourimagewiththeimageandcheckifitmatchesresult=face_recognition.compare_faces([image_to_be_matched_encoded],current_image_encoded)#checkifitwasamatchifresult[0]==True:printMatched:+imageelse:printNotmatched:+image文件结构如下:facialrecognition:fr.pymy_image.jpgimages/barack_obama.jpgbill_gates.jpgjeff_bezos.jpgmark_zuckerberg.jpgray_dalio.jpgshah_rukh_khan.jpgwarren_buffett.jpg我们的根目录,facialrecognition包括:fr.py的形式的人脸识别代码。my_image.jpg–即将被识别的图片(“新人物”)。images/–语料库。如果你按照前文创建文件结构并执行代码,如下是你能得到的结果:Matched:shah_rukh_khan.jpgNotmatched:warren_buffett.jpgNotmatched:barack_obama.jpgNotmatched:ray_dalio.jpgNotmatched:bill_gates.jpgNotmatched:jeff_bezos.jpgNotmatched:mark_zuckerberg.jpg显而易见,新名人是ShahRukhKhan并且我们的人脸识别系统可以识别!理解Python代码现在让我们解读代码来,并理解其工作原理:#importthelibrariesimportosimportface_recognition以上是引入操作。我们将通过已经建好的os库来读入语料库中的所有图片,并且通过face_recognition来完成算法部分。#makealistofalltheavailableimagesimages=os.listdir('images')这个简单的代码将帮助我们识别语料库中所有图片的路径。一旦执行这些代码,我们可以得到:images=['shah_rukh_khan.jpg','warren_buffett.jpg','barack_obama.jpg','ray_dalio.jpg','bill_gates.jpg','jeff_bezos.jpg','mark_zuckerberg.jpg']现在,以下代码将加载新人物的图片:#loadyourimageimage_to_be_matched=face_recognition.load_image_file('my_image.jpg')为了保证算法可以解析图片,我们将人物脸部图片转化为特征向量:#encodedtheloadedimageintoafeaturevectorimage_to_be_matched_encoded=face_recognition.face_encodings(image_to_be_matched)[0]剩余的代码相对简单:#iterateovereachimageforimageinimages:#loadtheimagecurrent_image=face_recognition.load_image_file(images/+image)#encodetheloadedimageintoafeaturevectorcurrent_image_encoded=face_recognition.face_encodings(current_image)[0]#matchyourimagewiththeimageandcheckifitmatchesresult=face_recognition.compare_faces([image_to_be_matched_encoded],current_image_encoded)#checkifitwasamatchifresult[0]==True:printMatched:+imageelse:printNotmatched:+image此时,我们:对每个图像进行循环操作。将图像解析为特征向量。比较语料库中已经加载的图片和被识别的新人物图片。如果两者匹配,我们就显示出来。如果不匹配,我们也要显示结果。如上所示,结果显示这个简单的人脸识别算法进行得很顺利。让我们尝试将my_image替换为另一个图片:当你再次运行这个算法,将会看到如下结果:Notmatched:shah_rukh_khan.jpgNotmatched:warren_buffett.jpgNotmatched:barack_obama.jpgNotmatched:ray_dalio.jpgNotmatched:bill_gates.jpgNotmatched:jeff_bezos.jpgNotmatched:mark_zuckerberg.jpg很明显,系统没有将马云识别为以上的任何一个名人。这意味着我们的算法在以下方面都表现得很好:正确地识别那些在语料库中存储的人。对语料库中不存在的人物进行标注。人脸识别算法的应用人脸识别是一个成熟的研究方向,已被广泛地应用在工业界和学术界。例如,一个罪犯在中国被捕可能

1 / 19
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功