地震、臺風等災害后,基礎設施網絡(如電網、水網)的快速恢復關乎城市運轉。但傳統維修調度常陷入“各自為戰”的困境:多個團隊重復作業、路線繞遠,導致恢復時間延長。近日,北京航空航天大學團隊提出一種基于深度強化學習的AC-MCTS算法,通過AI“全局指揮+沙盤推演”模式,讓多維修團隊協同效率顯著提升。在228節點電網模擬中,該算法相比傳統方法將恢復時間縮短近20%,彈性損失(衡量網絡功能恢復的綜合指標)降低14%,相關成果發表于《Frontiers of Engineering Management》。

災后維修的“兩難困境”:多團隊協同為何這么難?
基礎設施網絡(IN)如同城市的“血管系統”,一旦因災害受損(如電網節點和線路故障),需快速調度維修團隊恢復。但現實中,這一過程常面臨兩大難題:一是路線規劃難,維修團隊可能因信息不對稱繞遠路,浪費時間;二是順序決策難,先修哪個節點、哪條線路,直接影響整體恢復效率。傳統方法要么依賴人工經驗,要么采用單一團隊調度模型,難以應對多團隊、多任務的復雜場景。

以2021年某地區臺風災害為例,當地電網186條線路、62個節點受損,3個維修團隊因調度混亂,部分團隊重復奔赴同一區域,導致關鍵變電站修復延遲12小時,數十萬用戶停電超4天。“這就像沒有指揮的交響樂,每個樂手自顧自演奏,結果一團糟。”研究團隊解釋,多團隊協同需兼顧全局最優,而非單個團隊的局部效率。

AI“指揮官”的雙重智慧:從“軍師獻策”到“沙盤推演”
為破解這一難題,團隊研發了AC-MCTS算法,核心是“演員-評論家神經網絡(ACNN)+蒙特卡洛樹搜索(MCTS)”的雙重架構。簡單說,ACNN像“軍師”提供決策建議,MCTS則像“沙盤推演”模擬各種維修方案,最終選出最優策略。

ACNN的“全局視野”:它接收電網受損狀態(如哪些節點/線路故障、團隊當前位置),輸出兩個關鍵信息——“先驗概率矩陣”(建議優先維修的節點/線路)和“價值評估”(預測該決策的恢復效果)。例如,當檢測到某變電站(一級節點)故障,ACNN會賦予其更高的維修優先級,就像急診醫生優先處理危重癥患者。

MCTS的“推演能力”:基于ACNN的建議,MCTS會模擬未來多步維修動作,比如“團隊A先修線路(i,j)再修節點j,團隊B先修節點k”,通過上萬次“推演”計算每種方案的彈性損失和恢復時間,最終選擇全局最優解。這種“瞻前顧后”的能力,避免了傳統算法“走一步看一步”的局限。

更巧妙的是雙層決策架構:艦隊級(協調多個團隊)和團隊級(優化單個團隊路線)。前者確保團隊間不重復作業,后者規劃最短維修路徑。例如,在228節點電網中,5個團隊分別負責不同區域,AC-MCTS會動態調整任務分配,讓高能力團隊處理復雜節點(如變電站),普通團隊修復簡單線路。

實測驗證:228節點電網恢復時間縮短近20%
團隊在Python中模擬了4種電網受損場景(隨機生成災害中心和半徑),對比AC-MCTS與PPO、DDPG等5種算法的表現。以最嚴重的案例1為例:62個節點、186條線路受損,3個維修團隊參與恢復。結果顯示,AC-MCTS算法實現恢復時間984小時,彈性損失202.45,而傳統HHG方法恢復時間1011小時,彈性損失256.5;即便是先進的PPO算法,恢復時間也長達1034小時,彈性損失232.3。

更關鍵的是,AC-MCTS的效率穩定性:隨著受損規模增大(如從34個節點增至62個節點),其運行時間僅從84秒增至97秒,而傳統ASC方法從208秒飆升至312秒。“這意味著在大規模災害后,AI指揮官能快速響應,不會因數據量激增而‘卡頓’。”團隊補充。

從電網到“城市血管”:AI調度未來可期
該算法不僅適用于電網,還可推廣到水網、交通網絡等基礎設施。例如,城市供水管道破裂后,算法能調度維修團隊優先修復主干管道,減少居民斷水時間。未來,團隊計劃進一步研究“初始資源分配”問題,讓維修團隊在災害發生前就完成最優部署,同時探索多智能體DRL,讓每個團隊具備自主協調能力。

專家評價,這種“AI+基礎設施恢復”的模式,為城市韌性建設提供了新思路——當災害來臨時,我們或許能比以往更快地按下“重啟鍵”。

來源: 工程管理前沿