應用方向:
在該研究中,高光譜成像技術(HSI)主要應用于三文魚地理來源溯源及真實性檢測。通過分析光譜和紋理數據,結合深度學習與數據融合策略,HSI成功實現了不同產地三文魚的精準分類,并有效檢測出摻假現象,為水產品真實性鑒定提供了快速、無損且高效的解決方案。此外,研究開發了一種基于HSI數據的智能云平臺,實現了實時分類,展示了該技術在食品溯源中的實際應用潛力和擴展性。這些成果凸顯了HSI在食品質量檢測與多維數據分析領域的廣泛前景。
背景:
三文魚因其富含氨基酸、蛋白質、不飽和脂肪酸等營養成分,在全球備受歡迎。然而,由于不同地區的地理環境和生長條件存在差異,不同產地的三文魚質量和價格差異顯著,這使得其地理來源成為潛在的欺詐目標。傳統的三文魚產地識別方法多依賴于對外觀(形狀、紋理和顏色)的人工觀察,但這種方法效率低下且耗時耗力。目前,農產品溯源領域常用的方法包括穩定同位素分析、感應耦合等離子體質譜法和多元素分析,但這些方法通常存在實驗復雜、成本高昂以及對樣品造成不可逆損傷等問題。因此,亟需探索一種快速、準確且無損的三文魚地理來源識別方法。
高光譜成像(HSI)是一種快速且無損的檢測技術,能夠結合光譜和圖像數據進行樣本分類,具有較高的分辨率和魯棒性。本研究基于HSI技術結合信息融合策略與深度學習模型,旨在解決三文魚的地理來源溯源問題,為市場穩定和食品安全提供技術支持。
實驗設計
1.1材料與方法
本研究中四種新鮮的三文魚樣本來自中國的劉家峽地區、法羅群島的Bakkafrost以及成都通威三文魚有限公司。這些三文魚在捕獲后立即被去內臟、放血并冷凍,使用無菌刀具去除頭部、尾部、皮膚和骨骼進行處理。然后,每種三文魚被切成500份,每份尺寸為40×50×15 mm,重量為40±5 g。
本研究中,三文魚片的高光譜圖像是使用江蘇雙利合譜科技有限公司的“Gaia”高光譜分選機獲取。該系統包括一個Image-λ “Spectrum”系列高光譜相機(Image-λ-V10E-PS),兩套200W的鎢鹵燈光源,一個電動控制的移動平臺。“Gaia”高光譜分選機的光譜范圍從388-1036 nm,光譜分辨率為2.8 nm,每個像素點共有256個波段。在實驗過程中,每種三文魚獲得了500張高光譜圖像。在采集樣本之前分別獲取高光譜圖像的黑白幀,以便對高光譜圖像進行黑白校正。使用分析軟處理收集到的高光譜圖像以提取ROI獲取各樣本平均光譜值,采用二階統計方法從樣本中提取紋理信息。
為了從光譜數據中去除噪聲并防止數據失真,本實驗采用了Savitzky-Golay平滑作為一種預處理方法,基于一系列實驗和經驗考慮,將窗口大小設置為17。在本研究中,采用了LightGBM和GBDT算法來消除冗余和無關信息以提高模型效果。然后對集成機器學習模型(隨機森林、LightGBM和GBDT)、CNN-BiGRU深度學習模型、深度學習模型(MSADBO、CNN和BiGRU)三種模型結果進行對比,得出*優模型。同時,設計了一個自建的物聯網云平臺,以實現對不同三文魚地理來源的實時檢測。
1.2.結果
(1)不同類別三文魚片的光譜特性
使用HSI獲取了包括挪威三文魚、法羅群島三文魚、淡水彩虹鱒魚和智利三文魚四個類別三文魚樣本的光譜。圖1展示了這四種三文魚類別的平均光譜,可以觀察到這四種三文魚類別的整體光譜趨勢大致相似,但反射率值有所不同。然而,在大多數情況下,僅憑視覺是無法準確區分三文魚類別的。因此,進行有效的波段分析以提取相關信息,用于分類模型是必要的。
圖1. 四類三文魚的平均光譜
此外,還識別出幾個與不同官能團相對應的常見吸收峰。在可見光至近紅外光譜范圍(400-1000 nm)內,光譜顯示出明顯的峰值和谷值,觀察到的吸收信息主要與樣本中有機大分子官能團的基本振動相關(例如,C-H、N-H、O-H和S-H)。在可見光區域(400-760 nm),在450 nm左右觀察到一個顯著的吸收峰,歸因于肌紅蛋白和總色素的吸收。在650-700 nm,觀察到高反射率,反映了三文魚的紅色光譜特征。在近紅外區域(700-1000 nm),在760 nm出現吸收峰,對應于O-H伸縮振動的第三泛音。此外,在980 nm觀察到輕微的下降,對應于O-H伸縮振動的第二泛音。這些觀察表明,樣本中光譜反射率的變化可以歸因于它們化學性質的變化。換句話說,不同品種的三文魚由于化學性質的差異而表現出不同的反射率。總之,400-1000 nm可以表征三文魚肉質的特性,為后續三文魚來源的追溯提供了理論基礎。
(2)特征變量貢獻分析
在全波段建模計算中,LGB和GBDT模型始終產生*穩定的結果。因此,本研究僅通過LGB和GBDT模型選擇重要波長進行分類。LGB和GBDT算法被用來對光譜和紋理融合模型的2133個變量進行特征選擇,每個算法提取的前30個貢獻最大的特征變量被分別用于分析(見圖2)。對特征變量重要性的分析顯示,兩個模型的光譜特征變量更集中于650 nm,而紋理特征更集中于400-450 nm和700-800 nm的單波段灰度圖像。特別值得注意的是,在640-670 nm的光譜區域觀察到最高的貢獻率。從圖1可以看出,這些光譜區域主要與色素、蛋白質和水分有關,導致三文魚片中高反射率,并突出了三文魚的光譜特性。
圖2.特征重要性分析結果:(a) LGB模型TOP30特征變量貢獻;(b) GBDT模型TOP30特征變量貢獻
(3)光譜建模分析
使用237個連續波段的光譜數據和傳統機器學習(ML)算法建立了三文魚溯源模型。數據預處理采用了SG平滑方法,窗口點數設置為17。利用LGB、RF、GBDT和STACK四種監督模式識別方法對三文魚的地理來源進行了區分。預測結果如圖3所示。
圖3.光譜模型的模擬結果。(a)原始數據ML算法的譜模型結果;(b)原始數據深度學習算法的光譜建模結果;(c)SG平滑后ML算法的光譜建模結果;(d)SG平滑算法的譜模型結果后深度學習算法的譜模型結果
從模型結果可以看出,傳統的ML模型、集成學習模型和深度學習模型在測試集上的分類準確率表現出令人滿意的穩定性,結果保持在87%到93%之間。此外,經過SG平滑處理后,所有模型的準確率都有所提高,在訓練集上提高了0.1%到3.2%,在測試集上提高了0.2%到4.3%。這一現象可以歸因于SG平滑有效地糾正了原始光譜中的曲率和偏移。另一方面,在CNN-BiGRU模型中,改進的正弦算法注入了強大的全局探索和局部開發能力,顯著提升了模型的分類性能,整體準確率比優化前提高了0.5%到4.3%。值得注意的是,在基于光譜數據的ML模型結果中,集成學習模型表現突出,以訓練集95.8%和測試集93%的準確率展示了最佳的分類性能。然而,與ML模型相比,深度學習模型在基于光譜數據的分類任務中表現不佳。這是因為深度學習需要大量數據進行訓練,但在處理低維數據時更容易出現過擬合。
(4)紋理模型分析
本研究基于8個選定的特征紋理信息建立了三文魚的紋理分類模型。為了消除光譜數據維度的差異,特征紋理信息經過了歸一化預處理,以確保數據的一致性。采用與光譜模型相同的機器學習和深度學習方法區分三文魚的地理來源。如圖4所示,經過歸一化處理后,所有模型的準確率都有所提高,訓練集上的提高范圍從0.7%到13.1%,測試集上的提高范圍從2.7%到15.1%。這種提高可以歸因于高維高光譜圖像中熵評估的復雜性和無序性,因此歸一化紋理信息有助于減少熵對分類結果的影響。
圖4.紋理模型的建模結果:(a)原始數據的ML算法紋理模型結果;(b)原始數據深度學習算法紋理建模結果;(c)歸一化預處理后的ML算法紋理模型結果;(d)歸一化預處理后的深度學習算法紋理模型結果
從ML的角度來看,集成學習模型繼續保持著強大的性能。在歸一化紋理數據的分類結果中,訓練集和測試集的準確率分別提高了1.3%至3.1%和0.8%至3.9%。盡管歸一化處理顯著增強了分類結果的準確率,但傳統的ML方法在提取紋理信息等數據類型的特征時仍面臨一些挑戰。相比之下,CNN-BiGRU模型在處理紋理信息方面的分類性能遠高于傳統ML模型。值得強調的是,改進的DBO-CNN-BiGRU模型進一步提高了分類準確率。訓練集和測試集的分類準確率分別達到了92.8%和92.5%,這展示了深度學習模型在處理高維和復雜數據,尤其是紋理數據方面的*越性能。
(5)融合模型分析
本研究采用了一種信息融合策略,整合光譜和紋理數據構建了一個全面的數據模型。總體而言,融合模型展現出了令人滿意的分類性能。每個模型都顯示出一定程度的改進,這表明利用光譜和紋理兩方面的信息有助于捕捉不同三文魚類別之間的差異。在這些模型中,MSADBO-BiGRU取得了最佳結果,在訓練集和測試集上的準確率分別為99.6%和99.5%,與優化前的DBO-BiGRU相比,測試集準確率提高了0.7%。分類結果如圖5所示。法羅群島三文魚和智利三文魚更容易被混淆,而彩虹鱒魚很少與其他三文魚種類混淆。從傳統ML模型的結果來看,LGB、RF、GBDT和STACK模型的分類性能同樣令人滿意,測試集準確率分別為94.3%、96%、93.3%和96.3%。值得注意的是,與單獨的ML模型相比,集成學習模型一貫展現出穩定性,并表現出最佳的分類性能,測試集準確率提高了0.3%到3%。此外,為了進一步提升模型性能并降低數據維度和冗余,使用了GBDT和LGB算法進行特征變量選擇,最終結果如表1所示。結果表明,與全變量建模相比,ML模型的準確率提高了0.2%至0.7%,這表明GBDT和LGB算法成功地選擇了關鍵變量,從而減少了HSI數據中的共線性和冗余問題。相比之下,STACK模型取得了最佳結果,在訓練集和測試集上的準確率分別為97.4%和96.3%。總之,整合光譜和紋理數據的信息融合策略的分類性能優于使用單一光譜或紋理數據的*優模型。
圖5.融合模型的建模結果:(a)ML算法的融合建模結果;(b)深度學習算法的融合建模結果;(c)LGB的混淆矩陣;(d)RF的混淆矩陣;(e)GBDT的混淆矩陣;(f)STACK的混淆矩陣;(g)DBO-CNN-BiGRU的混淆矩陣;(h)MSADBO-CNN-BiGRU的混淆矩陣
(6)深度學習互聯網智能云平臺用于最佳分類結果可視化
基于本研究,發現基于HSI技術的信息融合策略與深度學習方法結合在三文魚溯源方面具有巨大潛力。然而,傳統的模型預測方法限制了其在實際應用中的實時能力和靈活性。此外,對高維數據(如光譜和紋理特征)進行多次訓練迭代不僅耗時,而且增加了模型擴展的難度。此外,傳統方法無法實現遠程訪問,給用戶帶來不便。因此,為了解決這些問題,本研究構建了一個基于互聯網的智能云平臺,用于追蹤三文魚的來源。云平臺的分類結果如圖6所示。基于深度學習模型,借助光譜和紋理的融合數據,平臺利用MSADBO-CNN-BiGRU算法處理融合數據,以實現三文魚的溯源。在平臺投入使用之前,將實驗中的所有2000個融合數據(分為70%的訓練集和30%的測試集)輸入深度學習模型進行訓練。盡管本研究開發的智能云平臺可能尚未達到工業標準,評估其功能的可靠性和穩定性是必要的。結果如表2所示,證明了平臺的平穩運行。此外,為了驗證平臺在應用中的可靠性,通過上傳包含融合數據的文件到平臺進行測試,可以獲得如圖8所示的四種三文魚來源區分結果,平臺的分類準確率超過99%,這表明三文魚溯源檢測系統在三文魚地理來源區分方面具有很大的應用潛力。
圖6.云平臺分類的結果。(a)法魯三文魚。(b)虹鱒。(c)挪威三文魚。(d)智利三文魚
結論
由于不同產地之間價值差異顯著,三文魚經常成為欺詐行為的目標,因此精準識別其產地具有重要意義。為了解決這一問題,本研究構建了一種結合HSI信息融合策略與深度學習方法的模型,旨在快速、準確地追溯三文魚的地理來源。研究結果如下:(1)在比較的四種不同的ML模型中,STACK模型表現出較高的分類穩定性和準確性;(2)深度學習在處理高維和復雜數據方面表現出色,其分類性能顯著超過ML模型,測試集準確率高達99.5%,MSADBO-CNN-BiGRU模型測試集準確率比優化前的CNN模型提高了0.8%至7%;(3)信息融合的結果表明,與僅使用單一光譜和紋理模型相比,分類準確率有所提高,尤其是融合模型的性能遠遠超過紋理模型,表明融合模型展現出最佳性能。總之,本研究成功地將深度學習方法與基于HSI的信息融合策略相結合,實現了三文魚產地的精準追溯,為市場穩定和食品安全提供了保障。同時,該研究為未來基于HSI信息融合策略與深度學習方法的農產品快速、無損追溯研究提供了技術支持。
推薦產品
“Gaia”高光譜分選機
作者簡介
通訊作者:許麗佳,四川農業大學機電學院,博導
參考文獻
論文引用自一區文章:Zhiyong Zou , Dongyu Yuan , Qingsong Wu , Qianlong Wang, Menghua Li ,Jiangbo Zhen , Chong Xu , Shutao Yin , Qiang Cui , Man Zhou , Lijia Xu , Salmon origin traceability based on hyperspectral imaging data fusion strategy and improved deep learning method , Food Control 166 (2024) 110740
相關產品
免責聲明
- 凡本網注明“來源:化工儀器網”的所有作品,均為浙江興旺寶明通網絡有限公司-化工儀器網合法擁有版權或有權使用的作品,未經本網授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:化工儀器網”。違反上述聲明者,本網將追究其相關法律責任。
- 本網轉載并注明自其他來源(非化工儀器網)的作品,目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時,必須保留本網注明的作品第一來源,并自負版權等法律責任。
- 如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。