深夜的麥田中,一臺(tái)自動(dòng)駕駛收割機(jī)正轟鳴作業(yè)。突然,幾個(gè)彎腰撿拾遺漏作物的農(nóng)民身影出現(xiàn)在探照燈光邊緣——傳統(tǒng)監(jiān)控系統(tǒng)很可能忽略這些“隱形人”,而一場(chǎng)事故或許就在下一秒發(fā)生。針對(duì)農(nóng)業(yè)機(jī)械作業(yè)中行人檢測(cè)的痛點(diǎn),湖南農(nóng)業(yè)大學(xué)研究團(tuán)隊(duì)開(kāi)發(fā)出YOLOv8n-SS算法,讓密集農(nóng)田中的微小目標(biāo)與遮擋行人無(wú)所遁形。

農(nóng)機(jī)監(jiān)控的“視力缺陷”
當(dāng)前智能農(nóng)機(jī)依賴(lài)計(jì)算機(jī)視覺(jué)實(shí)時(shí)感知環(huán)境,但在農(nóng)田復(fù)雜場(chǎng)景中面臨雙重挑戰(zhàn):一是密集人群相互遮擋,二是遠(yuǎn)處農(nóng)民在低分辨率畫(huà)面中如同“像素點(diǎn)”。傳統(tǒng)YOLO等模型在標(biāo)準(zhǔn)場(chǎng)景表現(xiàn)優(yōu)異,一旦遇到光照多變、機(jī)械遮擋的農(nóng)田環(huán)境,漏檢率便急劇上升。研究顯示,現(xiàn)有模型在農(nóng)田密集行人檢測(cè)中的平均精度(mAP)不足75%,相當(dāng)于每四個(gè)行人中就有一個(gè)可能被系統(tǒng)“視而不見(jiàn)”。

給AI裝上“高清鏡頭+智能聚焦”
研究團(tuán)隊(duì)從兩方面改造了YOLOv8n模型的核心結(jié)構(gòu):

SPD-Conv模塊:如同將模糊鏡頭升級(jí)為高清攝像,該模塊通過(guò)空間深度轉(zhuǎn)換技術(shù),把下采樣過(guò)程丟失的細(xì)節(jié)信息重新捕獲。傳統(tǒng)卷積層壓縮圖像時(shí)會(huì)丟棄大量像素信息,而SPD層將圖像拆解為精細(xì)拼圖后再重組,使遠(yuǎn)處農(nóng)民的工作服紋理也能清晰保留。
SK注意力機(jī)制:就像攝影師手動(dòng)選擇對(duì)焦點(diǎn),該機(jī)制讓AI自動(dòng)識(shí)別關(guān)鍵特征。當(dāng)畫(huà)面中出現(xiàn)被農(nóng)機(jī)半遮擋的農(nóng)民時(shí),系統(tǒng)會(huì)動(dòng)態(tài)融合不同尺度卷積核的觀測(cè)結(jié)果,給草帽、手臂等關(guān)鍵部位打上“高光標(biāo)記”,避免將人體誤判為稻草堆。
實(shí)測(cè)效果:漏檢率降低70%
在包含4.7萬(wàn)行人的CrowdHuman數(shù)據(jù)集測(cè)試中,新算法交出了突破性成績(jī)單:

密集人群檢測(cè)精度(mAP@0.5)達(dá)83.6%,比原模型提升7.2%
復(fù)雜場(chǎng)景泛化能力(mAP@0.5:0.95)達(dá)58.7%,提升9.2%
真實(shí)農(nóng)田測(cè)試中召回率躍升14.9%,意味著每10個(gè)行人能多檢出1.5人
更直觀的對(duì)比出現(xiàn)在暗光場(chǎng)景:當(dāng)傳統(tǒng)模型(YOLOv8n)把樹(shù)蔭下的農(nóng)民漏檢時(shí),改進(jìn)模型(YOLOv8n-SS)不僅精準(zhǔn)框出所有目標(biāo),連人物輪廓置信度都提高15%以上(如圖)。在嚴(yán)重遮擋的麥?zhǔn)請(qǐng)鼍埃滤惴ㄉ踔聊茏R(shí)別出僅露出頭盔的拖拉機(jī)后方人員。

智慧農(nóng)業(yè)的安全基石
這項(xiàng)突破意味著農(nóng)業(yè)機(jī)械化正獲得更可靠的“安全衛(wèi)士”。當(dāng)自動(dòng)駕駛拖拉機(jī)在果園行進(jìn)時(shí),系統(tǒng)能實(shí)時(shí)發(fā)現(xiàn)彎腰采摘的果農(nóng);聯(lián)合收割機(jī)作業(yè)時(shí)可自動(dòng)避開(kāi)拾穗者。研究團(tuán)隊(duì)指出,該技術(shù)已具備移植到農(nóng)用無(wú)人機(jī)、果園機(jī)器人的條件,未來(lái)將結(jié)合目標(biāo)跟蹤技術(shù),構(gòu)建從預(yù)警到緊急制動(dòng)的完整安全鏈條。

隨著我國(guó)農(nóng)業(yè)勞動(dòng)力短缺加劇,智能農(nóng)機(jī)滲透率持續(xù)提升,這項(xiàng)兼顧精度與效率的技術(shù)(模型體積僅5.2MB),為“無(wú)人農(nóng)場(chǎng)”提供了關(guān)鍵安全保障。正如論文通訊作者李延飛教授所言:“讓機(jī)器看懂農(nóng)田里的人,是智慧農(nóng)業(yè)不可逾越的起點(diǎn)。”

來(lái)源: 農(nóng)業(yè)科學(xué)與工程前沿