太湖水面照片中蓝藻色调的提取ExtractionofcyanobacteriahuefromphotoofTaihuLakesurfaceCHENLixiong1,2,3,HUYong2,GONGCailan2(1.MerchantMarineCollege;ShanghaiMaritimeUniv.,Shanghai201306,China;2.ShanghaiInstituteofTechnicalPhysics,ChineseAcademyofSciences,Shanghai200083,China;3.GraduateSchool,ChineseAcademyofSciences,Beijing100039,China):Becausethederivedhuebydifferentwaterspectralcollectionmethodsisnotabsolutelystableanditsrationalityisdifficulttobeverified,awayoftestinghuederivedfromspectrumthroughextractinghueinformationfromdigitalphotosofwaterinTaihuLakeisproposed.Toensuretheconsistencyofdigitalcameralargefieldandspectrometersmallfield,the256×256pixelregionsofphotosarecutoutincludingcyanobacteriaasmuchaspossible.Hueisextractedfromthepixelswithlargerdifferencebetweenblueandgreenchannel.Theresultshowsthathuefromdigitalphotoandthatfromspectrumhavehighrelevancewhenusingthesamecamera.Therationalityofhuederivedfromspectrumcanbeverifiedbyextractinghuefromdigitalphotos,andthereliabilitycanalsobeprovedbyphotosdirectly.0引言湖泊的富营养化是我国淡水湖泊面临的一个普遍的环境问题,而其重要特征之一就是藻类物质大量繁殖.叶绿素在藻类物质中所占比例比较稳定,并且易于在实验室测量,因此叶绿素含量常作为反映湖泊富营养化程度的一个重要参数.对叶绿素含量的监测,可以开展针对藻类物质的监测.利用遥感技术监测水体中叶绿素分布,具有监测范围广、速度快、成本低和便于长期动态监测的优势.[1]水质遥感监测是研究水体反射光谱特征与水质参数之间的关系,其中水体叶绿素与水面光谱反射率关系的研究,主要集中在半经验模型,即通过水体的实测光谱曲线,选择不同波段处的叶绿素光谱特征的反射率值与实测的叶绿素浓度进行统计回归,建立回归方程获取叶绿素浓度.[2]利用半经验法建立单波段、双波段、三波段、四波段和综合波段等叶绿素浓度反演模型.建立该模型必须对各自的测量数据进行筛选,用较为理想的数据拟合而成.由于各家的数据没有共享,建立的模型也不尽相同,因此模型不具备通用性和时间稳定性.为了全面了解太湖藻类的光谱特性,研究建立稳定的光谱反演叶绿素浓度模型,与太湖流域XX局,XX局无锡水文水XX局合作,对太湖水质和光谱进行每月一次、连续一年的采样.剔除不适宜光谱采集的测点,利用全年的正常数据,尝试半经验法的各种反演模型.因样本数较多,且横跨4个季节,各种模型的反演拟合度都不甚理想.在尝试找寻拟合度不如文献[2]等研究结果理想的原因时,比对实验室叶绿素浓度检测结果,发现不同测点在相似的叶绿素浓度下,对应的光谱特征曲线存在明显差异.查看同时获取的数码照片,发现叶绿素浓度相似而光谱特征差异明显的测点处,蓝藻颜色明显不同,也即蓝藻的颜色差异可能代表其生长状况的不同.[3]将体现蓝藻颜色的指数表征其差异,进而应用到模型研究中发现,利用光谱导出的水体色调与数码照片中蓝藻或水体的颜色具有良好的一致性,该过程及结论将另作说明.光谱的摄取用来分析研究对象的光谱特征,其导出的色调不具备直观性.本文拟从光谱采样时同时获取的数码照片中提取色调,并与光谱推导出的色调进行对比分析,验证光谱导出色调的可靠性.从数码照片中提取蓝藻的色调,首先要对照片按小块进行分析,选取照片中蓝藻覆盖的区域.可以将彩色图像分割看成是灰度图像分割技术[4]在各种颜色空间上的应用,有直方图阈值法、特征空间聚类法、基于区域的方法、边缘检测法、模糊方法、神经元网络法和基于物理模型的方法等.在自然光照条件下用图像分割技术分割田间成熟番茄的图像[5],足球机器人视觉处理子系统定位场上机器人和球的位置[6]等也是采用图像分割技术.1色彩空间的选择彩色图像按色彩空间分量分解成多个单通道图像,其中色彩空间可选RGB,HSI,Lab或其他色彩空间.[4]RGB根据三基色原理建立,是最基本的色彩空间,其他色彩空间模型通过RGB转化都可得到.HSI直接采用色彩特性意义上的3个量:亮度或明度(I)、色调(H)和饱和度(S)来描述颜色,比较符合人眼对颜色的描述习惯,但表示的颜色并不全是视觉所感受的颜色.Lab是根据色调和亮度组成的三维空间图,它适用于一切光源色或物体色的表示和计算.其中,L表示心理明度,a和b为心理色调,反映到坐标系统中,+a表示红色,-a表示绿色,+b表示黄色,-b表示蓝色,颜色的明度由L的百分数表示,其取值为0~100.人眼所感知的色彩通常由称为三基色的红R,绿G和蓝B等3种颜色混合而成,适合显示系统,并不适合图像分割和分析.因为这3个分量高度相关,即只要亮度改变,它们就会相应改变.而且,由于颜色空间很不均匀,所以两种颜色之间的知觉差异(色差)不能表示为该颜色空间中两点间的距离,而利用线性或非线性变换,则可以由RGB颜色空间推导出其他的颜色特征空间.Lab空间是一个均匀的颜色空间,但只适合两者之间的比较.HSI颜色空间与人眼的色彩感知相吻合,其中H分量与照片中人感受的颜色具有较高的相关性,在一些照明不均的场合特别有用,因色调与高亮或阴影无关,色调对区分不同颜色的物体非常有效.数码相机获取的照片是按RGB格式记录的图像.从RGB坐标系统到HSI坐标系统的转换见公式(1).2蓝藻的光谱特征对内陆湖泊藻类等叶绿素定量遥感探测的最基础研究工作之一是通过对湖面蓝藻等叶绿素的现场采样及光谱观测,建立合适的反演模型.其中对二类水体光谱测量的主要方法有剖面测量法和水表面以上测量法,目前唯一有效的方法是表面法.在已知文献中依据测量角度和原始数据处理方法的不同,表面法可以分为两种:有一定倾角的测量方法[7]和垂直测量法[8].在2008年5月―9月的太湖采样中,采用的是垂直测量法,2008年10月―2009年5月则同时采用两种方法.为了验证光谱垂直测量的有效性,与同时获取的倾斜数据进行对比研究,垂直测量光谱按公式(2)[9]进行处理.R(φi,φr)=Vi(φr)Vp(φr)•ki(φi,φr)(2)式中:ki(φi,φr)为反射参考板的光谱反射比;Vp(φr)为测量反射参考板时仪器输出的信号值;Vi(φr)为测量水体时仪器的输出值.光谱采集工作于每月上旬随太湖流域XX局,XX局无锡水文水XX局下湖组进行,有些采样时间对光谱采集不甚理想,整个数据需要根据采样情况进行取舍.水质同步获得的318个样本中,分别剔除21个飘浮藻、60个灰板不稳定、77个阴天和27个太阳高度角低的样本,实际有效样本133个.2008年10?┰隆?2009年5月同时采用倾斜测量的样本69个,叶绿素浓度范围为1.5~96.1mg/L.其中灰板不稳定是指在同一测点多次重复测量中,参考标准版光谱不稳定的情况;太阳高度角低的数据没有明确参考意见,暂拟4月―9月份选太阳高度角大于50°以上时间内的数据,因2008年10月―2009年3月的太阳高度角都较低,故选取10:00―14:00之间的数据.归一化后的蓝藻实测光谱曲线见图1.由图可见,太湖水体光谱具有明显的叶绿素光谱特征,在670nm附近出现叶绿素的吸收谷、700nm左右出现荧光峰、550nm左右出现绿色反射峰.比对实验室叶绿素浓度结果可知,吸收谷和荧光峰的强度随对应叶绿素浓度的不同存在明显差异,叶绿素浓度越是增加,吸收谷和荧光峰越显著,且在630nm附近出现反射率谷值呈肩状,同时在440nm处出现一个吸收谷,在740nm后维持较高的反射率.图1符合光谱采集条件的垂直测量归一化光谱数据选取叶绿素浓度为25mg/m3左右的测点光谱曲线进行对比分析,其光谱见图2,叶绿素浓度虽然相似,但其对应光谱特征曲线有时存在明显差异.查看同时获取的数码照片,发现叶绿素浓度相似而光谱差异明显的测点处蓝藻颜色差异明显,说明不同颜色的蓝藻明显干扰光谱特征曲线.蓝藻的颜色差异代表其生长状况的不同.[3]图2叶绿素浓度为25mg/m3左右测点的光谱3蓝藻水域照片特征及色调H值的提取物体的颜色取决于光源的光谱组成和物体表面散射波长的不同比例对人眼产生的感觉.例如,在日光下,一个物体散射480~560nm波段的光,相对吸收其他波长的光,该物体表面为绿色.白色光与水体的相互作用,通过散射和吸收两种方式转变为有色光,从而使水面呈现不同的颜色.[9]颜色是物体上散射波长400~700nm光线刺激人的视觉器官,进而在大脑皮层产生的主观感觉.颜色特性既可以从客观刺激方面衡量,也可以从观察者的主观感觉方面描述.描述客观刺激的是心理物理学概念,描述观察者主观感觉的则是心理学概念.颜色视觉有3种特性,从心理物理学方面讲是亮度、主波长和纯度,其相应的心理学方面是明度、色调和饱和度.[10]数码相机获取的图像以真彩色24位位图的格式存储.真彩色24位位图在存储格式上以3个字节表示图像中的1个像素点.这3个字节分别存储像素点的R,G,B颜色分量值,根据RGB颜色坐标系统合成这个像素点的颜色值.数码照片是RGB三通道能量的记录,虽然每种型号的相机对每个通道能量的记录不尽相同,具体的量化数值也不一样,最后显示的效果稍有差异,但总体真彩色图像不会失真太大,总体误差也不会太大.在太湖采样的1年期间,先后使用过佳能IXUSV2,美能达DIMAGEZ1,柯达V603和佳能A530共4个相机,有的相机照片偏红,有的相机照片总体有点发白,但并不影响对蓝藻等水体目标的观测效果.通过对实验地太湖测点水面照片在RGB三通道显示值的研究分析,水面有蓝藻的照片在三通道里显示的特性符合蓝藻及水的光谱特性,如果像素点是蓝藻,随着蓝藻的生长状况及拍摄时间等的不同,RGB三通道的绝对值会有较大差异,其中绿通道值较高而蓝通道值较低的特点比较突出,而水中白帽的像素点RGB三通道的值都挺高,显示为白色.没有蓝藻的测点照片,不管是清澈还是混浊水体,像素点RGB三通道的值差异不是特别明显.要从图像中提取蓝藻集中水域,根据蓝藻和水体等背景在光谱和数码照片上的差异分析结果可知,利用绿通道与蓝通道的差值作为特征值提取的效果比较好.从数码照片里提取蓝藻覆盖水域的流程见图3.图3数码照片中提取蓝藻覆盖水域流程光谱仪的视场角约为4°,可以认为视场内水体均匀.而相机是自动调焦的,视场角在20°以上,其视场内水体一般不均匀,截取的水体需要与光谱仪视场相似,才能保证两者提取的色调具有可比性.经过不同尝试,剔除照片中白帽和杂物等像素点,提取高绿水体的像素,其导出的色调与光谱仪反射谱推导出的色调H才具有一致性.光谱仪和相机采集一般在采样船的船首,而水质采样一般在船尾的左舷,因风浪流等混合作用,水面大体均匀,相差2~3m的采样距离对结果影响可以忽略,因此进行反演研究时不考虑其中的差异性.对于同一测点的多张照片,将远景和视场倾斜的照片删除,用近乎垂直水面拍摄的照片提取色