茄子又稱昆侖瓜、矮瓜、落蘇和酪酥等,屬于非呼吸躍變型果實,起源于亞洲東南熱帶地區(qū),西漢時傳入我國。茄子富含膳食纖維、維生素、多酚、蛋白質(zhì)和礦物質(zhì)等多種營養(yǎng)物質(zhì),具有降血脂、防治高血壓和糖尿病、保肝以及抗氧化等保健功效。茄子的生產(chǎn)和開發(fā)利用市場前景廣闊,然而茄子存在木栓化和爛果等缺陷問題,嚴(yán)重影響了茄子的產(chǎn)量和品質(zhì),進而降低了其商品性。木栓化可能是高溫或者氣候變化異常導(dǎo)致茄子鈣硼缺失引起;爛果則可能由蟲害、菌害、雨水和光照等因素造成。在實際生產(chǎn)過程中,將茄子木栓化和爛果樣本剔除仍然靠人工來完成,不僅耗時耗力、效率低下,還易造成漏選,因此實現(xiàn)一種能夠快速、準(zhǔn)確識別木栓化和爛果茄子的方法則尤為重要。
高光譜成像技術(shù)將光譜分析技術(shù)和數(shù)字成像技術(shù)相結(jié)合,可以同時獲得樣本大量波段的空間圖像信息和每一像素點的光譜信息,具有靈敏度高、測量速度快和抗干擾能力強等優(yōu)點,廣泛應(yīng)用于農(nóng)產(chǎn)品無損檢測、病害檢測等領(lǐng)域中。
本研究采用高光譜技術(shù)對茄子完好、木栓化和爛果進行檢測,通過多種預(yù)處理方法對原始光譜數(shù)據(jù)進行預(yù)處理,并建立PLS判別模型比較分析,選擇最佳預(yù)處理方法進行后續(xù)研究。采用SPA、RC和CARS對預(yù)處理后的光譜數(shù)據(jù)提取特征波長,基于特征波長分別建立PLS和MLR判別模型進行比較分析,以實現(xiàn)對茄子缺陷的定性判別,為進一步開發(fā)茄子在線分選裝備提供了理論依據(jù)。
1材料與方法
1.1試驗材料
為保證研究的可靠性,采摘時選擇大小(單果質(zhì)量450 g-680g)均勻,形狀為近圓球形以及缺陷類型(完好、木栓化和爛果)齊全得茄子作為試驗樣本,圖1所示為3類樣本圖。對其表面泥土進行清理,共挑選252個樣本,包含完好樣本170個,木栓化樣本60個和爛果樣本22個。采集各樣本的高光譜圖像,然后從中提取252個光譜數(shù)據(jù),運用Kennard-Stone算法將3類樣本按近似3:1的比例隨機劃分為校正集樣本189個和預(yù)測集樣本63個。
2 基于高光譜數(shù)據(jù)的茄子外觀品質(zhì)定性判別分析
2.1茄子完好、木栓化和爛果3種區(qū)域的平均光譜曲線圖
使用ENVI4.7軟件的提取感興趣區(qū)域(ROI)函數(shù)分別提取茄子的木栓化、爛果和完好3種區(qū)域的光譜數(shù)據(jù),然后計算并求取各類樣本的平均光譜,如圖2所示。“紫瓜”茄子呈類球狀,且表皮光滑發(fā)亮,導(dǎo)致采集到的高光譜圖像中間區(qū)域漫反射強度大、信噪比高,影響建模精度以及試驗可靠性。因此,在利用ENVI4.7提取感興趣區(qū)域時應(yīng)避開中間反光區(qū)域。
由圖2可知,完好茄子、木栓化區(qū)域和爛果區(qū)域的平均光譜曲線具有很大差別,在900~1300 nm范圍內(nèi),完好區(qū)域的反射率最高,原因可能是完好茄子表皮光滑,對光的反射最強;在1200 nm附近的3種曲線均為波谷,這是由于茄子表皮葉綠素的C-H基團二級倍頻吸收作用12;大于1350nm的波段范圍,完好區(qū)域的反射率低于木栓化和爛果區(qū)域的反射率。
2.2特征波段提取
特征波段來源于全光譜波段,攜帶其最重要的光譜判別信息。其作用主要有:消除原始數(shù)據(jù)的線性相關(guān)性、奇異性和不穩(wěn)定性;降低數(shù)據(jù)維數(shù),減少變量數(shù),排除多余的干擾信息等。特征波段的提取直接影響模型建立的效率以及建模后預(yù)測結(jié)果的可靠性和準(zhǔn)確性。
2.2.1連續(xù)投影法(SPA)
連續(xù)投影算法是一種使矢量空間共線性最小化的前向變量選擇算法。作為一種新興的特征波長篩選方法,它能夠有效消除波長變量之間共線性的影響,進而有效提取出特征波長變量。對normalize預(yù)處理后的樣本光譜數(shù)據(jù)進行SPA特征波長提取,如圖3所示。當(dāng)特征波長數(shù)為14時,RMSE值為0.3274,且值達到最小;所提取的特征波長分別為:931.02、924.64、1399.29、1093.68、950.17、902.3、1380.21、1147.86、895.91、1345.23、1265.68、1332.5、1173.34、982.08 nm,其重要程度依次遞減。
2.2.2回歸系數(shù)法(RC)
回歸系數(shù)法[15(RC):通過對預(yù)處理后的樣本光譜數(shù)據(jù)建立PLS判別模型,并從模型中提取回歸系數(shù)。本研究選取了9個特征波長值,分別為924、978、1103、1202、1367、1402、1586、1666、1681 nm,所依據(jù)的原則為:將局部極值作為特征波長值,如圖5所示。
3結(jié)論
3.1基于高光譜技術(shù)采集茄子樣本的高光譜數(shù)據(jù)。比較原始光譜數(shù)據(jù)和經(jīng)過多種預(yù)處理方法預(yù)處理后建立PLS模型,結(jié)果表明,經(jīng)Normalize預(yù)處理后的PLS判別模型效果最佳,其校正集決定系數(shù)R2為0.74,均方根誤差RMSEC為0.33;其預(yù)測集決定系數(shù)Rp2為0.85,均方根誤差RMSEP為0.26。
3.2采用SPA、RC和CARS分別對Normalize預(yù)處理后的光譜數(shù)據(jù)提取特征波長,基于特征波長分別建立PLS和MLR模型。比較多種模型可知,CARS-MLR模型效果最優(yōu),其校正集決定系數(shù)R2為0.94,預(yù)測集決定系數(shù)Rp2為0.90,RMSEC和RMSEP分別為0.19和0.21,預(yù)測集判別準(zhǔn)確率達到96.82%,較好地實現(xiàn)了茄子外部缺陷的檢測。