當地震或臺風導致電網癱瘓,如何快速調度多個維修團隊恢復供電?傳統方法常因路線重疊、順序混亂延長恢復時間。近日,北京航空航天大學團隊提出基于深度強化學習的AC-MCTS算法,通過AI“全局指揮+沙盤推演”模式,讓多團隊協同效率顯著提升。在228節點電網模擬中,該算法將恢復時間縮短近20%,彈性損失降低14%,為城市基礎設施災后快速重建提供新思路,相關成果發表于《Frontiers of Engineering Management》。

多團隊維修為何總“打亂仗”?

基礎設施網絡(如電網、交通網)是城市的“生命線”,但災害后的修復堪稱“復雜系統工程”。想象一個場景:某區域電網62個節點、186條線路受損,3個維修團隊同時作業——A隊奔赴城東修復線路,B隊卻已在附近搶修;C隊耗時3小時趕到偏遠變電站,卻發現關鍵工具未帶齊……這種“各自為戰”的混亂,根源在于傳統調度方法存在兩大短板:

局部最優陷阱:單一團隊調度算法(如LSTM)只關注自身效率,可能導致多團隊重復作業。例如2021年某臺風災害中,兩個團隊同時趕往同一變電站,浪費4小時搶修時間。

短視決策困境:人工調度依賴經驗,難以預判維修順序對整體網絡的影響。比如優先修復次要線路,可能導致主干電網恢復延遲,數十萬用戶停電時間延長。

“這就像沒有GPS的車隊穿越迷宮,每個司機只看眼前路況,整體必然低效。”研究團隊表示,多團隊協同需破解“路線規劃”與“順序決策”的雙重難題,而AI正是突破這一瓶頸的關鍵。

AI“指揮官”如何調度千軍萬馬?

AC-MCTS算法的核心是“演員-評論家神經網絡(ACNN)+蒙特卡洛樹搜索(MCTS)”的黃金組合。簡單說,ACNN像“軍師”提供決策建議,MCTS則像“沙盤推演”模擬最優方案,二者協同實現全局調度。

ACNN的“火眼金睛”:它接收電網實時狀態(故障節點位置、團隊當前坐標、維修能力),輸出“維修優先級地圖”。例如,一級變電站(權重>4)故障會被標紅,普通線路(權重<2)標藍,就像急診室的“三色分診”系統,確保資源投向最關鍵處。

MCTS的“時空推演”:基于ACNN的建議,MCTS會模擬未來100步維修動作。比如“團隊A先修線路(i,j)再修節點j,團隊B同步修復節點k”,通過上萬次虛擬演練,計算每種方案的恢復時間和彈性損失(網絡功能損失的量化指標)。這種“瞻前顧后”的能力,讓算法能提前規避路線沖突,就像下棋時預判對手下一步。

更巧妙的是雙層決策機制:艦隊層協調多團隊分工,避免重復作業;團隊層優化個體路線,縮短移動時間。例如在228節點電網中,算法會讓高能力團隊(如Crew 1,修復一級節點僅需1小時)主攻關鍵變電站,普通團隊負責周邊線路,實現“人盡其才”。

模擬測試:恢復時間縮短近20%,彈性損失降低14%

團隊在Python中模擬了4種電網災害場景(故障節點34-62個),對比AC-MCTS與PPO、DDPG等5種主流算法。在最嚴重的Case 1中:

  • 恢復速度:AC-MCTS耗時984小時,較傳統HHG方法(1011小時)縮短2.7%,較先進的PPO算法(1034小時)縮短4.8%;若增加至5個團隊,恢復時間進一步壓縮至670小時。
  • 恢復質量:彈性損失(RL)降至202.45,較HHG方法(256.5)降低21%,意味著網絡功能損失更小。
  • 效率穩定性:面對62個故障節點,AC-MCTS運行時間僅97.6秒,而傳統ASC算法需312秒,證明其在大規模災害中仍能高效決策。

“這相當于將原本10天的恢復周期壓縮到8天,減少數億元經濟損失。”團隊強調,算法的優勢在多團隊場景下更明顯——團隊越多,協同優化空間越大,傳統方法的調度混亂問題也越突出。

從模擬到現實:AI調度離實戰還有多遠?

目前,該算法已在228節點電網模擬中驗證有效性,但尚未應用于真實災害場景。研究團隊表示,下一步將重點突破兩大瓶頸:一是動態環境適應,比如應對災害現場突發的道路堵塞、團隊失聯;二是多網絡協同,如同時調度電網、水網、交通網的維修資源。

專家認為,這種“AI+基礎設施韌性”的范式,為城市防災減災提供了新工具。未來,當地震、臺風等災害發生時,AI或許能成為“隱形指揮官”,讓維修團隊像精密齒輪般高效運轉,更快恢復城市“生命線”。

來源: 工程管理前沿