摘 要 随着信息技术的发展,基于内容的图像检索技术已经成为一个研究热点。文章提出了一种颜色和纹理相结合的图像检索算法。首先在RGB颜色空间中对已经分割好的图像块求其三个通道的颜色平均值,进行离散余弦变换后取其低频分量作为颜色特征。用边缘直方图提取其纹理特征。最后综合利用这两个特征进行图像检索。实验结果表明,本文的算法具有较好的检索效果,有效地提高了检索的查准率和查全率。
关键词 RGB颜色空间;颜色平均值;二维离散余弦变换;边缘直方图;纹理特征
1 引言
近年来由于互联网络的快速发展,数字信息正海量的增长。传统的以文本的查询方式远远满足不了人们的要求,因此,基于内容的图像检索越来越受到人们的关注,成为了研究的热点。在基于内容的图像检索中,颜色和纹理是人们使用的最为频繁的视觉特征。人们单一的对颜色或者纹理特征提出了各种各样的算法,但是一种特征的方法只能表达图像的部分属性,往往满足不了人们的视觉需求。因此本文提出了一种综合利用颜色和纹理的图像检索算法。实验表明,综合颜色和纹理这两种特征可以得到比使用单一特征进行图像检索更好的效果。2 利用颜色特征进行检索
2.1 提取颜色特征
在国际标准MPEG-7中建议了一种描述符颜色布局[1],它表达了颜色的空间分布信息。在颜色布局描述符中,对分割好的8×8的图像取每一块图像的颜色平均值,形成一个颜色平均值矩阵,然后对其用二维离散余弦进行变换,取低频分量作为颜色特征。考虑到本文所选的测试图片都是bmp图片,以及减少计算量,提高检索速度的因素,本文的颜色布局描述符[2,3]的提取方法如下: (1)将整幅图像分成4×4块,计算每一块中所有象素RGB三个颜色通道的颜色平均值,并以此作为该块的代表颜色(主颜色)。 (2)将各块的颜色平均值进行离散余弦变换(DCT),得到DCT系数矩阵。DCT是一种分离的变换,是国际静止图像压缩标准JPEG的基础。由于大多数图像的高频分量较小,相应于图像高频分量的系数经常为零,加上人眼对高频成分的失真不太敏感,所以可用更粗的量化。因此,在一般检索中可以利用部分DCT系数作为特征向量。 (3)对DCT系数矩阵进行之字形扫描和量化,得到DCT系数。 (4)对于R、G、B三个通道,分别从DCT系数中取出4个低频分量,形成12个参数,共同构成该图像的颜色特征向量。2.2 相似度计算
国际标准MPEG-7中建议的颜色布局描述符在匹配时使用欧式距离公式,因此在本算法中匹配时也使用欧式距离公式,即为:3 利用纹理特征进行检索
3.1 提取纹理特征
在国际标准MPEG-7中建议了一种纹理特征描述符——边缘直方图[1]。边缘直方图是基于图像边缘的统计特征,能较好地反映目标的边缘和纹理特征,而且运算速度较高[4]。因此在本文中选取边缘直方图来提取图像的纹理特征。下面介绍一下提取的具体步骤: (1)将bmp图像转换成灰度图。每个象素的灰度值可以根据RGB颜色分量按下列公式计算得到: 。 (2)将整幅图像分成4×4块。 (3)分别对16块1/16子图像进行sobel边缘算子运算,得到边缘图像。 (4)统计子图像中的边缘直方图,该直方图包括4个直方条。(横轴为0,1,2,3四个边缘方向,纵轴为该方向上的象素数占子图像总的象素数的比率) (5)将16个子图像的直方条综合起来,得到包括64个直方条的整幅图像的边缘直方图。 下面介绍用sobel算子[5]提取图像边缘的具体算法: 首先介绍一下sobel算子中用到的4个核模板:
[8]电大学习网.免费论文网[EB/OL]. /d/file/p/2024/0424/fontbr /> (1)将图像中的象素点的灰度值分别与以上四个方向的核模板相乘。
3.2 相似度计算
仍然采用欧式距离公式作为相似度的计算公式,如下:4 利用综合特征进行检索

5 实验结果及结论
本文验证的系统的开发平台为Microsft Windows XP操作系统,赛扬2.0G的CPU,1G的内存。开发工具为vc++6.0。本文的实验图库为从标准测试图像库Corel图像库中选取的由海滩、恐龙、大象、马、花等组成的102幅图片。表1、表2给出这几类图片的查准率和查全率。表1 六类图片的查准率利用颜 色特征 | 利用纹 理特征 | 利用综 合特征 | |
海滩 | 0.583 | 0.500 | 0.833 |
恐龙 | 0.500 | 1.000 | 1.000 |
大象 | 0.417 | 0.333 | 0.583 |
马 | 0.583 | 0.833 | 1.000 |
雪景 | 0.167 | 0.250 | 0.333 |
花 | 0.500 | 0.667 | 0.833 |
利用颜 色特征 | 利用纹 理特征 | 利用综 合特征 | |
海滩 | 0.350 | 0.300 | 0.500 |
恐龙 | 0.300 | 0.600 | 0.600 |
大象 | 0.250 | 0.150 | 0.350 |
马 | 0.583 | 0.833 | 1.000 |
雪景 | 0.100 | 0.150 | 0.250 |
花 | 0.300 | 0.400 | 0.500 |
参考文献
[1]章毓晋.基于内容的视觉信息检索[M].北京:科学出版社.2003[2]郑楚君,杨志勇,何惠玲,常鸿森.DCT压缩域中图像颜色布局描述符的提取[J]. 计算机工程与应用,2005,35:167-168[3]顾红飞,张佑生,江巨浪.基于颜色布局的压缩图像检索研究[J].合肥工业大学学报(自然科学版),2006,29(1):1-4[4]F Malgouyres,F Guichard.Edge Direction Preserving Image Zooming:A Mathematical and Numerical Analysis[J]. SIAM Journal on Numerical Analysis,2001,39(1):1369-1390[5]刘彩.一种改进的Sobel图像边缘检测算法[J].贵州工业大学学报(自然科学版),2004,33(5):77-79
[8]电大学习网.免费论文网[EB/OL]. /d/file/p/2024/0424/fontbr />
相关文章:
学术论文范文(如何写出高质量的学术论文)04-26
初中数学小论文格式模板(该如何规范写作)04-26
大学生学术论文范文参考(如何找到高质量的参考文献)04-26
毕业设计论文模板大全(哪些模板适合使用)04-26