4月19日上午,由中央廣播電視總臺北京總站參與聯合主辦的人形機器人半程馬拉松在北京亦莊鳴槍開跑,引發了人們的廣泛關注。哪家企業的人形機器人跑得最快、穩定性最好,哪家機器人長得最可愛、最會整活兒,比賽過程中發生了哪些趣聞,成了大眾最為關心的焦點。那么機器人是如何學會跑步的呢?想象一個剛學走路的孩子跌跌撞撞的樣子,機器人學跑步的過程也同樣充滿挑戰。但不同的是,科學家們要用代碼和機械“教”會它們奔跑。這背后究竟需要幾步?讓我們用最直白的語言揭開這個黑科技的秘密。

機器人學會跑步的算法大概分三步:

第一步:模仿人類的“動作復刻大師”

機器人學跑步的第一步,就像剛學走路的小寶寶,先觀察大人怎么做!研發人員會用專業的“動作捕捉設備”,這就好比給人類跑步姿勢拍360度無死角的高清寫真。設備上的傳感器會精準記錄人體每一塊肌肉的運動軌跡、關節的彎曲角度,甚至連腳掌落地的力度都不放過,最后生成“一套超詳細的人類跑步動作寶典”。從技術角度看,這其實是運用了機器學習中的模仿學習算法。機器人就像拿著寶典的“學霸”,通過深度學習神經網絡,把人類的動作數據轉化為自己能理解的“代碼語言”,逐幀模仿人類手臂擺動幅度、腿部蹬地力度,在虛擬世界里先把動作框架搭建起來。雖然一開始它們的動作可能像提線木偶般僵硬,但這已經是邁向奔跑的關鍵一步!

第二步:虛擬世界的“瘋狂練習生”

掌握基礎動作后,機器人就要進入“魔鬼特訓營”——虛擬仿真平臺。在這里,它會開啟“自虐式”訓練模式:重復奔跑動作成百上千次,摔倒了立刻爬起來繼續或者重新學習,堪稱AI界的“卷王”!這個階段核心靠強化學習算法發力。簡單來說,機器人每完成一次奔跑動作,算法就會根據它的表現打個“分數”,比如速度達標加1分,姿勢標準加2分,摔倒扣10分。機器人的目標就是通過不斷調整自己的“運動參數”(比如關節轉動角度、步伐邁開的寬度),讓總得分越來越高。就像游戲里打怪升級,在大量的嘗試中,機器人逐漸摸索出最科學的奔跑節奏,從跌跌撞撞到健步如飛,這個過程可能要經歷成百上千次模擬!

第三步:現實世界的“實戰考核”

當機器人在虛擬世界練得“爐火純青”,接下來就需要接受現實世界的終極考驗!然而,現實可比虛擬環境復雜多了,地面的不平整、空氣的阻力、突發的障礙物、電池續航、關節發熱等每一樣都是“送命題”。機器人沒有“本能”,只有程序,沒有“經驗”,只有計算。為了不摔,開發人員會給機器人裝上各種“感知器官”:激光雷達掃描地形、攝像頭識別障礙物、慣性傳感器監測身體平衡。一旦機器人在奔跑中摔倒,它會立刻啟動反饋調節機制:把摔倒瞬間的傳感器數據傳回系統,結合虛擬訓練的經驗,重新優化動作策略。這就像人類摔跤后會總結“下次怎么避開石頭”,機器人則是通過模型迭代,在虛擬與現實的反復切換中,不斷打磨自己的奔跑技能。有的機器人甚至能邊跑邊學習,遇到新情況當場調整策略,堪稱“現學現賣”的高手!

看著機器人從笨拙模仿到靈活奔跑,就像看著自家孩子成長一樣。機器人們今天所跑出的每一小步,都將成為未來發展的一大步,我忍不住期待:下一個機器人黑科技,又會帶來什么驚喜?

供稿單位:重慶市九龍坡區科普創作與傳播學會

作者:重慶中機中聯檢測技術有限公司 教授級高級工程師 廖新雪

審核專家:九龍坡區融媒體中心主任編輯 田軍英

聲明:除原創內容及特別說明之外,部分圖片來源網絡,非商業用途,僅作為科普傳播素材,版權歸原作者所有,若有侵權,請聯系刪除。

來源: 重慶市科學技術協會

內容資源由項目單位提供