摘 要 眼睛是一个在人脸检测中极为重要的人脸特征,因此一种快速可靠的精确定位眼睛的算法对许多实际的应用是十分重要的。本文分析了几种常用的眼睛定位算法,并提出了一种基于肤色信息、人脸面部几何特征和人眼灰度信息的算法。算法采用由粗到细的检测策略,先对Anil K.Jain 的Cb、Cr椭圆聚类方法进行了改进,用改进的算法进行肤色提取,经过肤色区域的分析,对人脸区域进行预检测,然后结合人眼几何特征进行初步定位,再利用人眼的灰度信息进行精确定位。该算法定位效率高,并对背景、尺寸等细节具有很好的适应性,在人脸实时检测系统中具有很好的应用价值。
关键词 眼睛定位;肤色提取;几何特征;复杂度
1 引言
双眼是人脸的突出特征,它们在人脸中占据比较固定的位置,双眼间的距离刻画了人脸的大小,是人脸识别中尺度归一化的依据。因此双眼的精确定位成为人脸识别前处理阶段非常关键的一步,绝大部分的人脸识别算法都强烈地依赖于双眼的准确定位。只要人眼被精确定位,则脸部其他特征,如眉、鼻、嘴等,可由潜在的分布关系比较准确地定位。人脸可以较好地归一化,预处理的效果也更明显,同时也可提高识别速度和降低识别算法的复杂度。 正因为眼睛定位在人脸识别中具有如此重要的地位,于是人们研究各种算法来实现眼睛定位,主要可以分为以下几类:霍夫变换法、变形模板法、边缘特征分析法和对称变换法等,本文结合人脸的肤色和几何特征以及人眼的灰度信息提出了一种快速、稳定的人眼定位算法。2 常用的几种眼睛定位算法
(1) 霍夫变换法 假设经预处理已经得到包含眼球的图像Ep,为了节省检测眼球的时间并避免镜片反光点边缘产生的干扰,先用小灰度聚类法粗定眼球中心点,以此缩小检测范围,聚类的过程是将图像Ep中灰度值最小的n个像素,按列递增的顺序排序,若相邻的列数差值都未超过预先设定的门限T1,说明只有一个聚类中心,求出这些像素行列的平均值就是要找的眼球中心点;若超过了门限T1,说明这n个像素可以聚成两类,对左眼,因为阴影、镜脚集中在左边,所以取右边那类的平均值;对右眼,则取左边那类的平均值;n的选择可根据图像Ep的总像素数目及眼球占图像的大致百分比决定。 在用霍夫变换检测眼球前,先用Canny算法提取边缘。对于比较细长的眼睛,由于眼球的上半部分较多地被眼皮覆盖,所以改用检测下半圆,这样更可靠且省时。设图像空间为(i,j),i和j分别表示行和列,三维变换空间为(ie,je,R),其中ie、je分别代表眼球圆心的行和列,R为半径。下半圆表达式为: (1) 对于变换空间的每一个坐标点(ie,je,R),在图像空间都对应一个半圆,在这个半圆上存在的边缘点数就是变换空间上坐标点(ie,je,R)对应的值。变换空间上的峰值点坐标即为所求的眼球半圆参数。实验证明,霍夫变换确实具有抗干扰能力强的优点。当眼球与眼白的对比度较低时,提取出来的边缘是断裂或不很规则的,即使如此,仍能根据变换空间中的峰值点准确地定位眼球圆心[2]。 (2) 变形模板法 模板匹配法主要是模板的选择,根据所选模板的维数可分为二维可变形模板和三维可变形模板。图1为二维简单眼睛模板,由于人脸的旋转角度是任意的,当旋转角度比较大时,其中一部分眼白就会看不见,所以为了适应人脸向两侧作较大角度的旋转,就增加了两个单眼白的简单眼睛模板,当垂直旋转角度大于30°时,就使用仅有左眼白的简单眼睛模板,如图1 a所示,当旋转角度大于-30°时,就使用仅有右眼白的简单眼睛模板,如图1 b所示,若旋转角度介于-30°和30°之间,就使用正常的双眼白简单眼睛模板,如图1 c所示。第一个极小值点对应人的头顶,因为头发的低灰度产生了水平投影曲线的低谷,而曲线的最大值点和次最大值点分别对应人的额头部位和人的鼻中部,这样就可以轻易地求得人眼所处的大致水平位置(如图4所示)。 在边缘检测前先对眉眼区域进行去噪、增强处理,使图像平滑,这是保证下面边缘检测获得较好效果的关键步骤。然后用Canny算子求出眉眼区域的边缘图像[4],求解时阈值取得较高,使得边缘点仅由眉毛和眼睛的强边缘以及瞳孔产生的强边缘组成,而不会包含由鼻子的轮廓产生的弱边缘。随后将边缘点进行分组,可以得到几组分离的边缘,其中位于下面的两组分别为左右两眼产生的边缘,取这两个边缘组的中心作为人眼的中心。边缘分组算法中,将分别包含每个边缘分组的最小矩形作为人眼检出,最先检出的两个分组分别对应左眼和右眼。当出现两个分组后算法立即结束,提高了执行效率。
(a) 原图像
(b) 在水平方向上的投影
(c) 在垂直方向上的投影图4 水平方向和垂直方向的投影结果示意图 该算法的优势在于首先通过灰度投影曲线确定眉眼区域,使数据量大大减少,然后在有效的边缘检测之后,使用了高效的边缘分组策略,在保证正确率的基础上,提高了算法速度。此算法的定位错误出现在头部倾斜度过大,以及侧光太强,还有头部在图像中所占区域过小的情况。 (4) 对称变换法 在计算机视觉研究中,对称性被认为是物体的基本性质之一,通常在将物体从背景中分割出来后,用来简化物体形状的描述,或物体的近似。目前研究最多的是点对称(也叫中心对称)和轴对称,对人脸而言,眼睛、鼻子、嘴巴等都有很弱的点对称性,广义对称变换正是用来描述物体的点对称。文献[3] 利用广义对称变换定位人眼进而提取脸部特征,文献[4]在广义对称变换的基础上,定义了一种方向对称变换DST(Directional Symmetry Transform),用于人眼的精确定位。以上的对称变换利用了人眼的中心强对称和脸部特征的生理几何分布,对人脸偏转、脸部表情变化、光照变化等因素的左右不敏感,因而具有很好的鲁棒性。但是,以上对称变换的计算需要在大范围的尺度上进行,计算量很大,而且,由于只是描述了各点的局部对称性,当它用于人眼的定位时产生的候选点较多,不太利于眼睛的精确定位。 结合广义对称变化和方向对称变换的优点,于是有了一种新的对称变换——离散对称变换,它不仅具有广义对称变换描述物体对称性大小的特点,而且通过对各点领域的考察,去除那些处于规则区域外的点,可大大降低计算量,实现眼睛定位的快速算法。广义对称变换把图像中的所有像素点同等对待,每个像素点都计算其对称值。事实上,在图像中物体的单一背景区域中,大面积的灰度均匀区域上的像素点在一定的尺度范围内不具有明显意义的对称性,所以就不必计算它的对称值,而这样的像素点在人脸图像中占了很大一部分,如头发、脸部除眼、嘴等特征区域之外的区域及部分身体区域。眼、嘴、鼻子等特征区域在大于其轮廓的范围内灰度有变化,这样的区域我们把它称为灰度不均匀区。离散对称变换以减少计算量为出发点,在计算对称之前加入一个对图像灰度不均匀区域的检测步骤以减少计算量,然后定义了一个与广义对称变化相似的对称算子来计算点对称。 离散对称变换实际上可看成一种非线形滤波,由于对每个像素点都进行相同的领域处理,适合于并行处理,在定位圆形物体圆心时,算子领域采用圆环。通过图像的离散对称变换后,眼睛中心点附近像素的对称值一般都处在对称值最大的前四、五位,对具有强对称值的候选点,采用两条简单的规则进行筛选。规则(1):邻近像素合并,一般选取对称值内最大的前10位候选点,将其中位置相邻的候选点合并到它们中对称值最大的像素处;规则(2):几何约束判别,对经过规则(1)筛选后的候选点,利用眼在脸部的几何分布性质进一步筛选,取基本符合眼睛分布规律的两点作为最终的定位双眼结果。
3 基于肤色、几何特征和灰度信息的人眼定位
根据人眼灰度变化非常明显这一显著特点,本文提出的基于肤色、几何特征和灰度信息的人眼定位算法主要由以下几步组成。 (1) 肤色提取 肤色是人脸的重要信息,不依赖于面部的细节特征,对于旋转、表情等变化情况都能适用,具有相对的稳定性并且和大多数背景物体的颜色相区别。Anil K.Jain曾专门统计研究了皮肤的色彩模型,他提出的方法属于色彩空间中的聚类模型,这一类肤色模型的建立要选取一种合适的色彩空间。文献
[8]电大学习网.免费论文网[EB/OL]. /d/file/p/2024/0424/fontbr />[1]采用非线形分段肤色分割得到肤色区域在CbCr空间中近似于椭圆,可用如下公式表示:
(a)原图像 (b)Anil K·Jain的方法 (c)本文的方法图 5 肤色提取示意图
(a)标记人脸侯选区域 (b) 形态学滤波后的图像 (c) 人眼粗定位结果图6 眼睛粗定位示意图
4 实验结果分析
根据上面介绍的5个步骤,对眼睛的定位实验结果如图8所示。
(a) 原图像 | (b) 肤色提取后的图像 | (c) 标记人脸候选区域 |
(d) 形态学滤波结果 | (e) 人眼粗定位结果 | (f) 人眼精确定位结果 |
5 小结
一般的眼睛定位算法分为两个步骤:(1)粗定位。在精确定位眼球中心前一般要找到眼睛的大致位置,常见的方法有:对称性法、边缘点积分投影曲线极值位置判断法、神经网络法、多分辨率的马赛克图法等。(2)眼球的精确定位。常用的方法有:基于霍夫变换、几何及对称性检测、弹性模板等等。每个算法都有自己的优点和缺点也即局限性,如计算量太大、计算速度慢、算法不容易实现或正确定位率不高等。主要原因是由于人脸作为一个非钢体,在信息输入时存在尺度、位置、姿态变化问题,很难做到面面俱到,十全十美的算法。本文提出的基于肤色、几何特征和灰度信息的人眼定位算法有效的平衡了检测速度和稳定性之间的矛盾,实验证明,该算法定位效率高,并对背景、尺寸等细节具有很好的适应性,在人脸实时检测系统中具有很好的应用价值。参考文献
[1] Rein-Lien Hsu and Anil K.Jain, Face Detection in Color Images[J] IEEE Trans. Pattern Analysis and Machine Intelligence, may 2002[2] 王磊,莫玉龙.基于霍夫变换和眼睛弹性模板的眼睛特征提取[J].红外与毫米波学报,1999,2(18):53-60[3] CaiJ. Goshtasby A.. Detecting face in color images.Imageand Vision Computing[J],1999,18(1): 63-75[4] Canny J.A Computational Approach to Edge Detection [J]. IEEE Trans Pattern Anal&Mach Intell,1986,8(6):619-698[5] 于威威,滕晓龙等.复杂背景下人眼定位及人脸检测.计算机仿真[J] ,2004 第21卷,第7期[6] 陈杨,陈荣娟等编著.MATLAB 6.X 图形编程与图像处理[M]. 西安: 西安电子科技大学出版社[7] 朱夏君.人脸识别的研究及眼睛定位算法[C].硕士学位论文,浙江工业大学,2004
[8]电大学习网.免费论文网[EB/OL]. /d/file/p/2024/0424/fontbr />
相关文章:
公益林生态效益补偿政策对农户收入及政策满意度的影响04-26
初中教师专业伦理素养现状调查探讨——以河北省十所公04-26
基于XML的虚拟企业电子合同实现04-26
基于深度学习的软件实体识别方法04-26
乡村振兴视域下黄龙县农村治理能力提升思考04-26
论地域文化下甘肃舟曲多地舞蹈探究04-26
湖北医药学院附属人民医院儿童细菌性支气管肺炎病原学04-26
网购消费者负面评论中不礼貌策略探讨04-26