本研究應用了400-1000nm的高光譜相機,可采用杭州彩譜科技有限公司產品FS13進行相關研究。
我國擁有大量的文物,包括壁畫、書畫等,它們作為中國的傳統文物,可以記載古人的精神文化生活和重要的歷史事件。其中,最能直觀的了解文物所承載信息的當屬文字。中華文明源遠流長,早在舊石器時,就發現有文字的存在,從古代甲骨文到現代簡體字,文字一直是人類記錄事件和表達情緒的重要符號。古人留給我們眾多珍貴文物,且大都會用文字加以描述和修飾,探索文字的信息能更好的還原真實歷史,了解不同時期文化。然而,由于自然和人為因素影響,一些文物表面出現了褪色,影響外觀,導致文字難以辨認。因此,在文物保護工作中提取文字信息尤為重要。傳統方式多為人眼辨別,依賴文物工作者的經驗,但褪色的文字依靠人眼難以辨別。所以,需要利用現代科學技術輔助提取文物中褪色或者隱藏的文字信息。高光譜技術具有非接觸、“圖譜合一”、光譜范圍廣等特點,能夠對文物進行更深層次的數據留存與分析,利用高光譜獨特的優勢,可以捕捉到人眼觀察不到的信息,對于文字提取和解讀具有重要意義。
本研究使用的高光譜相機波長范圍為400-1000nm。
本研究數據為采集的國畫、石刻以及墓葬底部的高光譜數據,三處文物均受到了不同程度的損傷,導致文物表面的信息難以辨識,在進行數據預處理后,對其中的褪色信息進行提取,再利用卷積神經網絡進行文字識別,為文字辨識工作提供參考。對這三幅高光譜數據的字跡和背景區域分別進行提取,可以看到,國畫和石刻圖像上除了字跡以外,背景的主要顏色為棕色和白色。另外,在墓葬的高光譜數據觀察到存在紅色物質,也同樣作為背景區域。因此,實驗主要對這幾處物質的光譜曲線進行提取,每種物質選擇 10 到 20 個點,保存為 ASCII 文件,并建立均值光譜。其中,褪色較為嚴重的石刻數據,背景和字跡幾乎無法區分,只能在圖像右半部分采集幾處字跡的光譜曲線,其他的圖像在圖中進行均勻選點。如圖 5-2 所示,(a)、(b)、(c)分別為國畫、石刻和墓葬數據選取的光譜曲線對應位置。橘黃色點是選取的字跡區域,藍色、紫色和綠色點是選取的背景棕色、白色和紅色區域。圖 5-2(d)、(e)、(f)為國畫、石刻和墓葬經過平均后的光譜曲線圖,從圖中可以看出,字跡的光譜反射率較低,隨著波長的增加,反射率變化較小,而背景的反射率普遍較高,在不同波長下反射率值變化較大。經過高光譜數據優化有,對識別結果有顯著的改善。
對研究方法進行實驗與分析。首先,將字跡增強指數應用到三處褪色程度不同的圖像上,均得到了較好的增強效果,并與高光譜數據處理常用的兩種信息提取方法對比,通過目視解譯表明,字跡增強指數對于增強字跡的信息更具有適用性。其次,通過密度分割將文字信息提取得到二值圖像,由于石刻文字筆劃缺失較為嚴重,墓葬的符號懷疑是文字,而卷積神經網絡針對的是較為完整的漢字,因此僅對石刻和墓葬的提取結果進行形態學變換,提供多種變換結果輔助專家識別。最后,對文字較多的國畫圖像進行裁剪和形態學變換,輸入到卷積神經網絡中,得到排名前三的文字,共識別 17 個文字,正確率為 70.8%,這一結果證明了本研究的文字提取與識別方法是有效的。
銷售直撥:13858065387
固定電話:13858065387