油菜是我國重要的食用油來源,居5大油料作物之首。我國是世界油菜主產國,油菜面積、產量均居世界第一。然而,油菜在生長過程中雜草危害比較嚴重。傳統的化學除草一方面污染農業生態環境,而且除草劑使用效率比較低,因此正確識別雜草的關鍵便是實現除草劑的精確噴灑。
高光譜成像技術是一種融合了圖像處理及光譜分析的新型技術,其中圖像數據對農作物的表面損傷及外部特征可進行真實展現,而光譜數據則反映了作物內部的結構及成分。因此,近幾年高光譜成像技術被越來越多地應用于雜草分類識別、農產品品質無損檢測方面。
本工作采用多種預處理方和特征波長提取方法對油菜和雜草冠層的高光譜圖像數據進行處理,分別建立了基于全譜和特征波長的分類模型。通過分析比較不同分類模型的結果,可以得到不同光譜采集時間、不同油菜品種對雜草分類識別的影響。
1實驗部分
1.1樣本
實驗所用的油菜樣本和四種雜草,分別為稗子、和萌、苘麻和三葉鬼針草,均為油菜田內常見的影響較大的雜草品種,且與油菜的生長周期類似。圖1為試驗中所使用樣本的圖像。
1.2光譜圖像采集
應用了400-1000nm的高光譜相機,可采用杭州彩譜科技有限公司產品FS13進行相關研究。光譜范圍在400-1000nm,波長分辨率優于2.5nm,可達1200個光譜通道。采集速度全譜段可達128FPS,波段選擇后最高3300Hz(支持多區域波段選擇)。
油菜和雜草的高光譜信息采集共分為3次,依次定義為1,2和3。另外每次數據采集過程中,由于油菜和雜草都在生長,因此都需要對相機曝光時間、采集高度等內部參數進行調節從而獲取相對失真最小的高光譜圖像。表1為3次試驗時的高光譜成像儀的內部參數。
1.3數據特征提取
對所研究的油菜和雜草的高光譜圖像,提取每株植株的感興趣區域以整個去除背景之后的樣本區域為ROI,對ROI內計算并統計各波段的平均光譜,實現圖譜變換用于最終的數據處理。提取ROI的原則之一是盡可能地去除非植株冠層的區域,使得冠層區域圖像與背景圖像進行高程度的分割。分割冠層的方法如下:
(1)分析比較ROI區域和非ROI區域的像素點對應的光譜信息,尋找能夠區分這些點的波段,最終選取800 nm波段圖像作為掩膜,并設置閾值進行二值化構建掩膜;
(2)掩膜圖像中,背景區域變為0,而樣本信息區域變為1,對原始高光譜圖像進行掩膜,從而實現將背景區域去除的效果。圖2為基于高光譜662,554和450 nm三個波段下RGB偽彩圖的ROI獲取過程。
1.4數據處理方法
1.4.1預處理方法
采用正態變量變換、去趨勢化、多元散射校正、移動平均平滑法、多項式卷積平滑法、基線校正及歸一化對樣本的高光譜數據進行預處理。
1.4.2特征波長提取方法
采用主成分載荷、載荷系數法、回歸系數法、連續投影算法分別進行特征波長提取。主成分載荷挑選特征波長,主要是基于在不同的主成分下載荷值表明了波長的不同重要程度,因此選擇主成分載荷圖中的峰谷值為特征波長;載荷系數法(x-LW)根據x-LW曲線挑選特征波長,其中絕對值較大且為波峰的波長即為特征波長;RC曲線中的波峰、波谷和拐點即為通過回歸系數法)選擇的特征波長12]。SPA對數據組包含的向量多次連續的投影進行分析,降低數據含量的冗余度,提升計算的效率和速度。
2結果與討論
2.1油菜和雜草的平均光譜曲線
采集了380~1034 nm波長范圍的512個波段的近紅外光譜數據,由于噪聲明顯影響光譜的前端和后端,因此去除掉前后端兩部分的噪聲波段,采用453~934 nm之間380個波段的光譜進行分析,建立油菜和雜草的平均反射光譜曲線如圖3所示。從圖可知,油菜和四種雜草趨勢相似,雜草曲線較為分散,鬼針草和油菜有重合,但在550 nm波峰處反射率有明顯區分。
將樣本按照3:1的比例分成建模集和預測集,其中建模集72個油菜和48個雜草樣本,預測集24個油菜和16個雜草樣本。其中需要注意的是,四種雜草在建模集中每種12個樣本,預測集中每種四個樣本。
2.2主成分分析定性分析
對油菜和雜草光譜數據進行主成分分析可知,三次試驗PC1和PC2累計貢獻率為99%,PC1和PC2能夠解釋絕大部分的變量[4],三次試驗主成分得分分布圖如圖4所示。由圖可知,得分圖中油菜和雜草分別聚集在一起,進一步表明油菜和雜草可進行有效的鑒別,接下來繼續利用光譜數據進行分析和處理。
2.3基于全波段的分類識別結果
對光譜進行De-trending預處理,基于三種算法進行全譜建模,識別精度如表3所示。由表3可知,PLS算法第二次試驗分類效果未達到90.00%,SVM和ELM算法效果比較好,尤其是ELM算法分類精度最優,3次試驗均達到了100.00%。
2.4特征波長的分類識別結果
基于De-trending預處理,將上述四種方法提取出的特征波長所對應的反射率作為輸入變量,由于基于全譜的ELM模型判別效果在不同批次實驗之間效果較優,因此基于特征波長建立ELM判別分析模型。其分類結果如表4所示。
從表4可知,四種提取方法均得到了比較好的分類效果,采用PCA loadings,x-loading weights及SPA提取的特征波長建立的識別模型的分類效果非常好,建模集和預測集的分類效果均達到了100.00%。
銷售直撥:13858065387
固定電話:13858065387