多智能體控制產生于21世紀初。到如今已經(jīng)發(fā)展了二十余年。積累了大量的論文,常出現(xiàn)各類研究方向的介紹上,但多智能體控制究竟是做什么的,回望這二十余年的研究歷程,我們又得到了哪些啟示,未來又有哪些方向可以進一步努力,都是比較直接但又需要說明的問題,在這里就啰嗦一下個人的感受,供各位批評指正。

1. 概念的演進

控制理論的一個基礎和核心是對系統(tǒng)的研究,因此我們先從系統(tǒng)的概念開始梳理,按照時間線討論各個名詞的興起。從最早的大規(guī)模系統(tǒng)研究到現(xiàn)在的CPS研究,粗略分的話,與網(wǎng)絡相關的概念有五個。大規(guī)模系統(tǒng)或者叫網(wǎng)絡化系統(tǒng)、網(wǎng)絡化控制、多智能體系統(tǒng)、復雜網(wǎng)絡、信息物理系統(tǒng)。這五個的聯(lián)系與區(qū)別,可以看到,這五個各自產生了許多文章。

首先要清楚的是,這五個的發(fā)源地都是圖論。對于圖論的研究始于柯尼斯堡七橋問題。隨著技術進步,在工業(yè)上,我們遇到了需要將多個個體之間使用網(wǎng)絡通信相連的問題,既然是多個體相連,我們首先注意到的是它們之間的通信方式與通信效果,比如:

擁塞控制是在網(wǎng)絡中使用反饋的早期例子。在保持高吞吐量的同時,對向網(wǎng)絡中注入數(shù)據(jù)包的速率進行調節(jié)以避免擁塞(Jacobson,1988年)。事實上,TCP(后來的TCP/IP協(xié)議)正是互聯(lián)網(wǎng)的核心,也是互聯(lián)網(wǎng)迅速發(fā)展的原因之一。一般來說,網(wǎng)絡的運行需要多個層次的控制原則和控制回路。

進而關注點聚焦于:

從網(wǎng)絡傳輸數(shù)據(jù)包角度來看,具有三個重要特征:網(wǎng)絡處理傳入數(shù)據(jù)包的速度、由于網(wǎng)絡上的流量負載,數(shù)據(jù)包在到達預定目的地之前可能遇到的延遲,以及網(wǎng)絡可能遇到丟棄數(shù)據(jù)包的概率或可能性。

通信是網(wǎng)絡化控制的一個重要研究角度。這里就到了第一個區(qū)分點,大規(guī)模系統(tǒng)或者叫網(wǎng)絡化系統(tǒng)是多個個體,而中文表達上較為相似的網(wǎng)絡化控制則是偏向于控制器與被控對象通過網(wǎng)絡相連,也可以是單體系統(tǒng)。

90年代末,興起了兩件新事物,一個多智能體、一個復雜網(wǎng)絡。多智能體系統(tǒng)走入了人們的視野:

相對于網(wǎng)絡化系統(tǒng)對于通信速率的關注,多智能體系統(tǒng)則源于對“簡單規(guī)則產生復雜行為”的好奇與模仿,并且將這一問題抽象簡化為所有狀態(tài)收斂到同一數(shù)值的一致性問題展開初步研究。當然,隨著研究深入,這兩個方向也變得越來越融合了,但拿最新文獻對比,我們仍然可以看出一下研究思路上的細微區(qū)別:

比如,我們以可控性研究為例,多智能體系統(tǒng)可控性的文獻中,比如Chao Sun, Guoqiang Hu, and Lihua Xie. Controllability of Multiagent Networks With Antagonistic Interactions.IEEE TRANSACTIONS ON AUTOMATIC CONTROL, VOL. 62, NO. 10 ,會利用到拉普拉斯矩陣,換句話說,要想寫出這個矩陣需要提前知道網(wǎng)絡結構是怎樣的

而在同樣研究可控性的網(wǎng)絡化系統(tǒng)文獻中,Yuyu Zhou and Tong Zhou, A Revisit to the Controllability and Observability of Networked Dynamic Systems,IEEE Transactions on Control of Network Systems ,DOI 10.1109/TCNS.2021.3078070. 則用抽象的耦合矩陣代替了圖,而不需要提前知道網(wǎng)絡結構是什么樣子。反映了建模思路上的差異。

隨著考慮節(jié)點的增多,無論是畫圖分析還是給出耦合矩陣都變的力不從心,統(tǒng)計物理此時進入了人們的視野,小世界網(wǎng)絡、無標度網(wǎng)絡相繼誕生,每一個進入網(wǎng)絡科學學習的新人首先接受的也是各種統(tǒng)計量。復雜網(wǎng)絡的研究就這樣展開了。

隨著時間的推移,這幾個的界限是越來越模糊了,但從研究主流來看,如果搜索關鍵詞,大規(guī)模系統(tǒng)的研究高潮已經(jīng)逐漸過去,復雜網(wǎng)絡還是統(tǒng)計特色和社會類研究為主,多智能體和部分網(wǎng)絡化系統(tǒng)則更聚焦于一致性,網(wǎng)絡化控制則傾向于通信的具體實現(xiàn)。

我們暫停一下,仔細想一想這么一個問題,剛才的介紹里是不是不由自主的使用了某幾種假設?比如,復雜網(wǎng)絡使用統(tǒng)計物理的前提是什么?是網(wǎng)絡天生存在,只是我們不知道網(wǎng)絡具體結構。網(wǎng)絡化控制呢?控制器與被控對象通過網(wǎng)絡相連,該網(wǎng)絡也是類似于天生的。但到了多智能體系統(tǒng),本來一個個個體是獨立的,是我們設計了通信網(wǎng)絡將其連接在一起,也就是網(wǎng)絡人工設計。這里的區(qū)別是,天生網(wǎng)絡的研究成果往往需要所開發(fā)的方法適用于多么一般的網(wǎng)絡,而人工網(wǎng)絡的研究則需要實現(xiàn)目的即可,更多的可能要討論帶有某種最優(yōu)指標的拓撲設計問題。

那么,有沒有既有天生又有人工的呢?進一步,如果我們將天生網(wǎng)絡定義為物理耦合關系,即物理層。而人工網(wǎng)絡則稱為信息層。我們就得到了一個這幾年的熱詞:信息物理系統(tǒng)

一個概念的引入自然會帶來新問題,比如網(wǎng)絡攻擊問題。以往的網(wǎng)絡化系統(tǒng),很少有人考慮攻擊的問題,因為其屬于局域網(wǎng),且不與外界相連,攻擊的可能性很低,而隨著技術進步,尤其是工業(yè)互聯(lián)網(wǎng)的發(fā)展、數(shù)據(jù)分析技術的引入,在帶來方便的同時,也給了攻擊的機會,為理論分析提供了可行性。有了這個可行性作保證,無論是網(wǎng)絡化系統(tǒng)、多智能體還是復雜網(wǎng)絡都引入了安全的因素,相關文章成了這幾年的一個熱點。

又比如“將調整通信邊作為一種控制手段”,CPS系統(tǒng)結構帶來了調整拓撲聯(lián)系的可能性,這一點在2020年的TAC文章中有體現(xiàn):

In our paper, instead, we deal with the open problem of modifying the structure of the network of interaction in a multi-agent systems such that to obtain arbitrarily selected clusters.........by implementing a cyber-layer of controllers operating in parallel with the physical connections of the multi-agent system and providing the further inputs generated by the coupling terms of the control layer..........
(Lucia Valentina Gambuzza, Mattia Frasca,Distributed control of multi-consensus ,IEEE TAC,DOI 10.1109/TAC.2020.3006820)

從事多智能體系統(tǒng)研究的同行們可能覺得加邊、減邊這類操作比較新,但我們將視角轉向網(wǎng)絡科學,則會發(fā)現(xiàn),在網(wǎng)絡科學中的網(wǎng)絡性能分析中,像某種指標比如可控性在節(jié)點失效、邊失效、增加邊等變化下的魯棒性能問題工作還是不少的,可以參考香港城市大學陳關榮教授的工作。同樣的,節(jié)點失效、邊失效、增加邊等變化對其他復雜行為又有什么影響?進一步,如果把“節(jié)點失效、邊失效、增加邊”這類操作如果放在多智能體系統(tǒng)控制里去考慮,一個能貼近的場景是應變能力。我們以往考慮的系統(tǒng)往往都是固定的拓撲或者是按照一定規(guī)律切換的拓撲。問題在于,如果我們遇到一種突發(fā)情況,被動的改變拓撲的時候,怎么去處理這種情況?等等,這類工作與控制設計結合,最終都會歸為**最優(yōu)拓撲設計問題。**這些都是近年來概念演進帶來的一些新思路。

2.從基本一致性出發(fā)

關于多智能體系統(tǒng)協(xié)同控制目前主要研究在于一致性。一致性,簡單理解,就是網(wǎng)絡當中的每一個個體都達到了同一個狀態(tài)。**一個經(jīng)典結論在于有向生成樹的存在與一致性的強相關關系。**如果我們轉化一下,就可以歸結成微分方程的穩(wěn)定性問題。關于穩(wěn)定性問題,控制理論體系里有很多的研究工具。特別對于多智能體系統(tǒng)而言,針對拉普拉斯矩陣的性質。也有一些比較成熟的處理工具,大家如果看這方面論文認為比較多的話,相信都會有這樣一個感覺:場景雖然不同,但是核心方法都是類似的。

單看一致性,從被控對象上看:線性一致性、非線性一致性、時滯的一致性、異構的一致性、切換拓撲的一致性、從通信上,丟包的一致性,事件觸發(fā)的一致性、網(wǎng)絡攻擊條件下的一致性和彈性一致性,隱私保護的一致性,從應用上,編隊、合圍等。基本所有控制理論的經(jīng)典成果都可以用到多智能體一致性研究上。我們這里統(tǒng)稱是應用場景上的新東西。

我們這里并不打算念名詞,那樣就喪失了圖解的意義,但可以用幾條線串起來,比如一個很容易會產生的問題:**多智能體僅僅是一致就行了嗎?**首先我們來看這個一致性的定義。網(wǎng)絡中的每一個個體都達到同一個狀態(tài)。比如說這個狀態(tài)是位置信息的話,那么說。全部的個體從四面八方而來,都匯集到了一個位置。那么一個很自然的拓展就是,如果我們設計的目的是:要求一部分個體去A點會合,一部分個體去B點會合。或者說類似的這類情況。那么這種情況又該如何處理呢?這里就引出了一個有關鍵詞。叫分組一致或者聚類一致(group consensus or cluster consensus or multi consensus)。這方面的研究基礎是討論矩陣的零特征值的重數(shù),結合比較特殊的網(wǎng)絡結構(比如Eqiutable partition or Acyclic partition)或者滿足一定條件的組間耦合關系。這里多提幾句:group consensus 和 cluster consensus 還是有些區(qū)別的,group consensus不要求各個組之間狀態(tài)嚴格不同,做仿真有可能會出現(xiàn)不同組的曲線匯合現(xiàn)象,而cluster consensus往往會要求。

又比如近幾年的研究當中,出現(xiàn)了對于一致性的進一步限定。比如positive consensus:

The positive systems mean that the states of the systems can be always nonnegative for any nonnegative initial conditions. Some significant conclusions have been acquired for the positive consensus of integer-order multiagent systems (IOMASs).

再比如搞研究時經(jīng)常想到的“有何必要”疑問,如何我們按這個角度來看,讓所有個體都精確達到一個相同的狀態(tài),是永遠必要的嗎?比如我們需要驅趕群體越過某條線,大于某個值算個體通過,而不去管它究竟大了多少,或者對于投票模型,設定個體狀態(tài)超過某個數(shù)即為同意,只關心是不是同意票,而不關心個體同意的程度。這個目標在2018年被拿出來單獨研究,至今也產生了那么幾篇文章吧,稱作Herdability,屬于剛開始的研究階段。諸如此類有意思的概念,等等。

回到Consensus,有讀者就問了,以上是consensus的擴展,那對于consensus,有沒有一條線能串起來,讓大家清楚大部分工作在什么地方。在重新審視圖的時候,確實發(fā)現(xiàn)了這條線。就是權重形式的變化

最早的工作其實并不討論權重,只看是否連接,連接了就標為1。后來引入了權重的概念,使用數(shù)值為正的數(shù)來表示通信強度。從數(shù)學上,有正就有負,最為廣泛和成功的改造討論當屬符號網(wǎng)絡,考慮到符號網(wǎng)絡是對社會網(wǎng)絡的某種簡化,我們放在這里起到承上啟下的作用。所謂符號網(wǎng)絡,是指權重引入了負數(shù),用來模擬個體之間的對抗關系,像歷史上的諸多概念一樣,也是被不同學科的多人獨立發(fā)現(xiàn),最早考慮符號網(wǎng)絡的一致性問題的是Claudio Altafini 在2013年的文章,首次建立了結構平衡與一種特殊的狀態(tài):二分一致性的關系。揭示出當網(wǎng)絡滿足結構平衡特性時,可以收斂到絕對值相等、符號相反的兩個狀態(tài),而對于結構不平衡網(wǎng)絡則一般收斂到零。用通俗的話解釋結構平衡,就是這里有兩幫人,幫內團結、對外斗爭、達到了實力均衡。需要注意的是,二分一致的達成使用了針對符號網(wǎng)絡專門設計的協(xié)議。

有了有正到負的先例,2016年的一篇碩士論文里,討論了復權多智能體網(wǎng)絡的模一致性問題,但并未引起多少關注,這方面的一些理論成果尚待挖掘。以上都是權重為標量的情況,2018年受基于剛性圖編隊的啟發(fā),矩陣權重網(wǎng)絡重新得到關注,目前仍然出于非常初步的階段,現(xiàn)有研究大部分集中于對稱矩陣,一個值得一提的發(fā)現(xiàn)是,當研究者使用對稱正定和負定矩陣來將符號網(wǎng)絡二分一致性的結論推廣到矩陣權重圖時,很快發(fā)現(xiàn)按照Altafini 協(xié)議,即使在結構不平衡的情況,二分一致仍可達到。這個問題在上海交通大學Chongzhi Wang、Haibin Duan 的新工作得到了進一步揭示,這個結果也暗示我們,結構平衡只是某種更為深刻的機理的表面反映,仍然尚待挖掘。而已經(jīng)開始興起的矢量權重、非對稱矩陣權重、包括理論上的復矩陣權重等各類權重形式,很多情況下仍然是一片未知海洋。

3.生物、團隊與社會網(wǎng)絡的啟發(fā)

第二部分提到了目前對于基本一致性概念的一些改進和拓展。提到了幾個算是比較新的但也是能夠歸為一致性一類的概念。還以權重為主線梳理了目前的一致性研究。這部分就把思維稍微的發(fā)散一下。考慮一下場景問題。當然,這里所提到的場景,不是指之前提到的羅列關鍵詞的列表式場景,也不是將理論用到工程應用比如編隊的場景,這兩部分上邊這張圖已經(jīng)展示的比較詳細了。本片還是主要以理論視角為主。

其實在第二部分的研究的一些成果當中已經(jīng)有所提醒,**我們所追求的協(xié)同控制,它的關鍵點應該落在哪里?**或者說多智能體領域最初的研究動機是?我們這里來回顧一下多智能體系統(tǒng)研究的起源:

匈牙利Vicsek等人1995年發(fā)表在物理雜志PRL上的一篇文章,考慮在平面上運動的多個粒子,采用nearest neighbor rule相互局部協(xié)調,最終達到整體一致運動。這篇以仿真為主的文章在剛發(fā)表的幾年里沒有引起多大的關注,也沒有多少文章引用。Vicsek, T., Czirók, A., Ben-Jacob, E., Cohen, I., & Shochet, O. (1995). Novel type of phase transition in a system of self-driven particles. Physical Review Letters, 75(6), 1226.

我們可以很清晰的看到,雖然我們現(xiàn)在看到的大多數(shù)文章都是在研究一致性,但是,一開始的研究并不是為了追求一致性,而是重點放在了基于鄰居的規(guī)則。也就是代表了這樣的一個科學問題:通過局部的鄰居之間的簡單交互,如何去產生全局性的復雜的行為?

站在現(xiàn)在這個角度上。我們已經(jīng)知道的是,人們從控制協(xié)議的角度上針對不同場景提出了多種的方案設計。理論證明都能夠達到一致和預期的設計目標。但是這僅僅是問題的第一步。也就是說我們利用了已有的控制理論。實現(xiàn)了這一效果。但是達成各種一致這就夠了嗎?顯然不是。而如果我們繼續(xù)走,比如觀察鳥群的行為,有時候不是簡單的飛到一塊或者分成幾群就完事了,形狀的變化千奇百怪。這一點可以去看一下相關的紀錄片。那么它們呈現(xiàn)的復雜集體行為屬于什么機理?因此研究者們從生物學的角度也進行了進一步的探索,提出了一些仿生機理的方法,比如華中科技大學的Haitao Zhang課題組等。這些代表性的工作是從局部規(guī)則與群體行為的關系入手去考慮的,它代表著人們對于生物界中存在的群體行為的理解。這個問題到目前為止仍然沒有得到很好的解決。

鳥群、魚群等群體的集體行為引人關注,但我們要注意,有一個更大的群體就擺在眼前,那就是我們自己。

比如團隊合作里有很多問題其實值得進一步思考。舉個例子,有些時候談多智能體必說協(xié)同控制,那么我們來想象一下協(xié)同控制的流程,而不僅僅限于一致性,首先一個工程上的群體,我們需要給他安排一個任務。這個任務是需要共同完成的,那么這里就出現(xiàn)了一個問題:也就是誰去完成這個任務?是所有的人都去,還是一部分一部分的對任務進行分解之后,再去完成子任務,最后匯總成目標。第二個,如果是分解成子任務,那么分配就是一個關鍵問題,誰去比較合適?去多少人比較合適?這是都是問題。但是這些問題很少出現(xiàn)在控制理論的研究當中,但是在多機器人領域的研究還是比較多的,詳情可以參考:Cooperative Heterogeneous MRS_2019_ACM

不妨再大些,多智能體系統(tǒng),不僅可以用來建模工程系統(tǒng),還可以用來建模社會系統(tǒng)。一旦有了這么一個認識,那么很自然的就可以去考慮比如觀點動力學(Opinion Dynamic)問題,疾病傳播動力學問題。比如拿觀點動力學問題來說,雖然模型與工程系統(tǒng)不一樣,但是仍然存在著如何通過調控,使得最終群體達到一致意見的需求。而對于疾病傳播動力學模型,這幾年的熱度就不多說了。

雖然無論是觀點動力學還是疾病傳播動力學問題,以往都在其他領域都得到了大量的關注。但在這幾年,相關的研究在控制領域逐漸開始興起。人們開始利用控制理論的視角去分析了這些問題,相關的工作,**可以關注一下Ming Cao、Mengbin Ye、Ji Liu等相關課題組的工作。**利用已經(jīng)有的研究基礎,無論是控制系統(tǒng)的指標還是控制系統(tǒng)的設計方法,在這樣一個新背景下,能否得到新的結論,挖掘新的特性,都是一個未知的內容。這也是交叉學科的獨特魅力之一。

在提及的觀點動力學和疾病傳播動力學僅僅是兩個例子。在近些年的控制領域頂刊上,我們還可以看到對社會系統(tǒng)進行建模的,比如決策系統(tǒng)、投票系統(tǒng)都是屬于這一類,在這些理論的新背景下相關的研究,將推進我們對于一致性機制的理解。

順帶一提,既然討論社會網(wǎng)絡,那么智能因素是肯定要考慮的,雖然一開始的比如觀點動力學模型、傳播模型也是微分方程模型。但智能時代可以更進一步了,比如說,

①對于每個個體引入合作-競爭、或者博弈的因素。這在觀念傳播動力學模型近期研究文章當中是比較常見的方法。也就是說,如果賦予每個個體一定自主性(選擇權利),那么又是如何變化的?

②近幾年,計算機界風起云涌,機器學習這個概念從課本走向大眾。而在眾多的機器學習的概念當中,多智能體強化學習,同樣帶有多智能體這四個字。那么這就啟發(fā)我們。如果給每個個體引入記憶-學習的能力,放在我們所熟知的網(wǎng)絡里面,比如考慮網(wǎng)絡結構的多智能體強化學習,去探討我們上面提到的問題。又會得到怎樣的一種新的啟示?

數(shù)據(jù)驅動的觀念可以引入處理社會網(wǎng)絡的復雜性,以便進行更好的調控。

我們可以關注到,很多長期從事多智能體研究的課題組,近幾年也在轉向這個方向。一方面,雖然社會網(wǎng)絡也屬于經(jīng)典學科了,但帶著控制觀點去處理分析社會網(wǎng)絡確實是新興產物,尤其是這幾年大背景下,另一方面,大家也都在尋找未來的著手點。

當然,這種問題跨度大,難度高。是多個學科共同關注的問題,并且多次入選了自然雜志年度科學問題表里面。值得一提的是,2021年諾貝爾物理學獎獲得者喬治帕里西也研究過這個問題(可以參考科普著作《隨椋鳥飛行》)。無論是數(shù)學界、生物界、物理界還是計算機界等,都有大量的學者在探索這個問題,但是每個學科都有其獨特的方法論。對于我們而言,雖然不能一下子就全部跳到這個領域進行攻關,但是相關成果我們是可以借鑒的。原因正如上邊所說。**對于控制學科來說,我們不僅期望的是探索新場景的機理,我們更期望的是受到啟發(fā)設計調控的方式。**比如考慮博弈或者學習的系統(tǒng),理論分析存在很高的價值,也出現(xiàn)了很多可以稱為經(jīng)典的分析工作,但實際應用上怎么說服設計人員去采用?這一點需要深入挖掘,尤其是跟傳統(tǒng)方法對比,有什么傳統(tǒng)方法解決不了的問題。這將是控制科學框架下的研究重點。

4.網(wǎng)絡主干剖析:圖論

從控制理論誕生那天起,系統(tǒng)分析與控制就形影不離了。系統(tǒng)特性為我們設計控制器提供了很多方便,更有很多時候系統(tǒng)性能直接否定了控制的可能性。因此,即使在專注于控制器設計的工作,也會在最開頭列出使用幾條假設。因此,專門研究系統(tǒng)性能的工作是值得單獨一個單元來討論的。

說到群體的性能研究,除了上部分提到的生物集群,我們也會想到上個世紀末誕生的網(wǎng)絡科學,網(wǎng)絡科學目前也發(fā)展出了許多經(jīng)典成果,由于處理節(jié)點比較多,大部分使用統(tǒng)計概念和統(tǒng)計工具去描述網(wǎng)絡,側重于網(wǎng)絡行為揭示和性能分析。而在閱讀相關文章中,我們很多時候能夠看到作者對于網(wǎng)絡的結構進行的一些假設,比如包含一棵有向生成樹,圖是連通的等等,這些假設是為了后續(xù)結論的討論和證明方便而設立的。如果我們把多智能體系統(tǒng)不斷簡化提煉,那么我們得到的就是一張圖。因此,雖然側重點和工具不同,網(wǎng)絡科學和多智能體系統(tǒng)仍然具有天生的可結合點。

網(wǎng)絡科學里有很多結論指向了網(wǎng)絡的特殊結構。嚴格來說,特殊結構這個對于控制領域的研究人員也不算陌生,在上個世紀發(fā)展出的“系統(tǒng)的圖表示”理論中我們已經(jīng)見識過了。對于網(wǎng)絡尤其是特殊網(wǎng)絡結構的研究,能夠產生幫助我們理解、輔助我們設計的有效工具。這里我們簡單舉一個例子:

在圖論里面有一個概念叫做Equitable partition,為了討論方便,我們這里討論最為簡單的圖。即無向無權重無符號圖。我們將具有相同鄰居節(jié)點的個體稱為等價節(jié)點,這種節(jié)點的重要標志是它接收的和傳出的信息是完全一樣的。因此在全過程里,它們狀態(tài)始終一致,在不引入新的控制信號條件下,無法使得它們之間達到不一樣的狀態(tài)。也就是控制理論當中所描述的不可控情況。當然這里描述的比較簡單,具體證明就不展開了。受這個現(xiàn)象啟發(fā),對于任何一個網(wǎng)絡化系統(tǒng),只要根據(jù)該網(wǎng)絡化系統(tǒng)的特點,找到接收和發(fā)出信號完全一樣的節(jié)點,并給出針對性的尋找方法,那么我們就可以在可控性上得到相關的結論。正如第二節(jié)所提到,這種節(jié)點間狀態(tài)始終一致的現(xiàn)象,在研究分組一致時獲得了高度重視。我們今天去搜索這個關鍵詞時,除了從圖論角度討論數(shù)學問題的文章,基本都是在各個領域應用這一特性討論分組一致的文章,大多發(fā)表于物理學期刊,有些文章也發(fā)表在了控制領域的頂級期刊上。目前這種工具已經(jīng)成為分組一致研究領域一種常用的工具。

更多的,對于網(wǎng)絡特殊結構的研究,可以大體分為以下幾個角度:

第一就是某種網(wǎng)絡結構對于系統(tǒng)性能的影響,這里面涉及的內容比較多。像路圖、樹圖,環(huán)圖等,圖論當中的擴張、匹配等,還有一些圖的工具,比如獨立強連通分量、等價劃分、零迫集等。研究的性能指標也相當?shù)亩啵窨煽匦浴⒖捎^性、魯棒性、可鎮(zhèn)定性、結構可控性、結構可觀性等等等等。

第二是在第一基礎上,什么時候 我們構造 什么樣的網(wǎng)絡結構 來完成什么樣的指標 是最好的,或者對處理問題是方便的。

第三是新型網(wǎng)絡的建模。借鑒了圖論的一些新成果,比如矢量、矩陣權重網(wǎng)絡,再比如超圖。也誕生了一些比較不錯的交叉工作。

對系統(tǒng)性能的研究進一步豐富了設計控制器時需要注意的原則和可以優(yōu)化的思路。我們舉例子時經(jīng)常說,這種控制方法處理一萬個節(jié)點的網(wǎng)絡怎么辦?這里我們就看一下如果一個網(wǎng)絡中有一萬個節(jié)點會對系統(tǒng)分析與控制有什么影響?

對分布式的嚴格要求:盡管我們使用了分布式協(xié)議,但不少協(xié)議的設計過程相較于集中控制優(yōu)勢并不明顯,仍然需要精確知道全局信息,假設都一萬個節(jié)點了,如果還是整體設計,單純算矩陣就費勁,如果其中幾個節(jié)點失效了呢,又該怎么處理,是不是還得再對萬維大矩陣下手?完全分布式或者分散設計的作用在此時體現(xiàn)出來,相較于完全分布式控制(可參考Zhongkui Li課題組的工作),使用完全分布式的判據(jù)去分析系統(tǒng)性能,大多數(shù)時候還是一個開放問題

未知帶來的挑戰(zhàn):一萬個節(jié)點情況,未知的情況很多,比如這堆節(jié)點內部怎么連接?即使知道了全部結構,每條邊上的權重呢?或者節(jié)點動力學是什么情況?都是問題。對于未知,人們一方面開發(fā)了數(shù)據(jù)驅動的方式去控制,這點跟網(wǎng)絡科學使用統(tǒng)計工具去處理很相似。進一步,針對具體未知的情況分別討論:針對內部連接不知道的情況,網(wǎng)絡科學有社團發(fā)現(xiàn)的相關研究,控制里面也有工作嘗試從輸出觀察網(wǎng)絡結構(可觀性)的研究。針對權重不知道的情況,人們想起來了結構化系統(tǒng)理論的概念,放到網(wǎng)絡上就是研究一類系統(tǒng),它們網(wǎng)絡結構一樣,邊權重不一樣,這類系統(tǒng)的共同性質。可以參考An overview of structural systems theory。

5.未來在特色問題上

幾千字無法窮盡多智能體的研究,就在寫文章的這個上午,幾篇新工作可能已經(jīng)悄然上線,我們無法精確預料到五年后的多智能體系統(tǒng)研究會有什么新因素出現(xiàn),新權重、新網(wǎng)絡,網(wǎng)絡科學交叉等誰會搶先出現(xiàn)突破、占據(jù)主流,更不用說有可能一種嶄新的理論會產生并席卷控制理論了。但是,如果我們從脈絡上把握,而非糾結具體名詞,那預測顯而易見:特色問題。

談到控制學科,它的目的是實現(xiàn)對系統(tǒng)的調控,那么它的核心基礎就是對系統(tǒng)的認識和剖析,所以需要抓住所研究系統(tǒng)的特性進行進一步的討論。以上這句話大概是每一個接觸過控制學科的人都知道的,但是這里面仍然有一些值得思索的內容,比方說,拿到一個研究成果,它真的符合這句話嗎?

我們可以在控制理論結構圖當中任選一個名詞,并且把它加上多智能體的前綴,放到任何一種文獻庫,里面都能搜到很多篇文章。 我們這時候回頭再來看開頭的一句話,就是這些文章的特色究竟是在什么地方?或者說的更清楚一點,就是這些處理方法,**有沒有抓住多智能體系統(tǒng)的特色?**我們這里不再多言前面四個部分具體提到的特色。但我們回過頭來去看前四部分的這些開創(chuàng)性的工作,就可以很簡單的得到一個道理,所有的開創(chuàng)性都是根據(jù)這個系統(tǒng)自身的特色而來,這對于控制研究來說就是一個啟發(fā),如果說你深刻的了解了系統(tǒng)的特色,抓住了這個系統(tǒng)的一些小小的特性,你就能夠出一些開創(chuàng)的工作,進而去解決別人沒有解決甚至沒有意識的問題。

特色不是一成不變的,而是隨著概念演進會不斷出現(xiàn),因此不必擔心特色被挖掘清楚的情況,有些讀者可能會問,新特色傳統(tǒng)控制方法解決不了,那是不是非得轉行啊。對于這個問題,有這么一段話說的很好,

在一個更大的問題框架下利用控制理論的思想和技術,也能探索實現(xiàn)更加符合時代的“系統(tǒng)”的可行性。1950年的飛機大炮工業(yè)生產需要維納控制論,2050年的無人駕駛、無人工廠、聯(lián)網(wǎng)基礎設施、災難救援動物保護等等也需要新的“控制論”,方法和技術手段不斷在迭代適應新的基礎設施和硬件條件,但歸根結底還是對系統(tǒng)加以研究和分析以及實現(xiàn),并沒有脫離控制理論本身,兼收并蓄博取眾長可能會是一個好的心態(tài)。

控制理論這個詞,如果要準確的來說,應該叫做系統(tǒng)調控理論,控制理論每個時期都應該有不同的內涵,這是需要突破的,至少在認識上要突破,如果我們從已有的控制理論框架去思考問題,我們的思維就有可能局限于這個框架,心里往往想的是如何去繼續(xù)做,然后產生一個好摘的果子都摘完的感覺,但是如過從研究初心出發(fā),奔著解決問題去,不要排斥任何東西,強化學習也好,博弈論也罷,這些東西在他們各自領域閃閃發(fā)光,把他們搬過來,能不能用到我們這里?

6.結語

經(jīng)歷二十余年,多智能體控制領域即使“單純羅列概念得用一張A4紙”,這條擁擠的賽道有人退出,有人泛化,有人繼續(xù),也有新人在門外張望,又是一年畢業(yè)季和申博讀研擇校招生季,祝好吧。

來源: 系統(tǒng)與控制