在時(shí)光長(zhǎng)河的沖刷下,老照片褪色斑駁,劃痕與折痕肆意蔓延,如同歲月無情的爪痕;古老石窟寺廟中的精美壁畫,歷經(jīng)千年風(fēng)雨,色彩剝落、畫面殘缺,似在默默低訴往昔的輝煌與如今的滄桑。傳統(tǒng)修復(fù)手段面對(duì)這些復(fù)雜破損時(shí),往往力不從心。但如今,生成式 AI 圖像修復(fù)技術(shù)宛如擁有超凡魔力的 “時(shí)光修補(bǔ)匠”,為破損影像的重生帶來希望。

在文化遺產(chǎn)數(shù)字化保護(hù)研討會(huì)等前沿科技交流平臺(tái)上,生成式 AI 圖像修復(fù)技術(shù)已成為行業(yè)熱議焦點(diǎn)。來自計(jì)算機(jī)視覺、文物保護(hù)等領(lǐng)域的專家學(xué)者,圍繞該技術(shù)的算法突破、應(yīng)用場(chǎng)景及倫理規(guī)范展開深度研討,分享了利用其修復(fù)敦煌壁畫殘片、老照片褪色細(xì)節(jié)等典型案例。這項(xiàng)技術(shù)憑借在文物保護(hù)、影視修復(fù)等場(chǎng)景展現(xiàn)的創(chuàng)新性,為文化傳承與科技創(chuàng)新的融合發(fā)展提供了新路徑。

圖源:Pixabay

這項(xiàng)技術(shù)的 “智慧內(nèi)核” 源自深度學(xué)習(xí),其中生成對(duì)抗網(wǎng)絡(luò)(GANs)堪稱核心引擎。生成器與判別器恰似兩位針鋒相對(duì)卻又相互成就的 “對(duì)手”,在持續(xù)不斷的競(jìng)賽中共同成長(zhǎng)。生成器如同技藝精湛且不斷進(jìn)取的畫家,拿到帶有破損區(qū)域的圖像后,憑借從海量圖像數(shù)據(jù)中習(xí)得的色彩、紋理和結(jié)構(gòu)規(guī)律,精心勾勒出填補(bǔ)破損部分的內(nèi)容。判別器則搖身一變,成為嚴(yán)苛的 “評(píng)委”,仔細(xì)甄別每一幅圖像,精準(zhǔn)判斷其究竟來自真實(shí)世界的完整圖像,還是生成器創(chuàng)作的 “修復(fù)品”。

當(dāng)判別器看穿生成器的 “作品” 時(shí),生成器便會(huì)迅速調(diào)整策略,優(yōu)化自身 “繪畫手法”;而當(dāng)判別器被 “欺騙” 時(shí),表明生成器的修復(fù)水平又實(shí)現(xiàn)了一次質(zhì)的飛躍。在這般反復(fù)的對(duì)抗與優(yōu)化進(jìn)程中,生成器輸出的修復(fù)圖像愈發(fā)逼近真實(shí),最終達(dá)到以假亂真的境界。除了 GANs,變分自編碼器、循環(huán)神經(jīng)網(wǎng)絡(luò)等模型,以及能夠聚焦圖像重要區(qū)域的注意力機(jī)制,也從不同維度為圖像修復(fù)添磚加瓦,共同構(gòu)建起堅(jiān)不可摧的技術(shù)支撐體系。

在實(shí)際應(yīng)用領(lǐng)域,生成式 AI 圖像修復(fù)技術(shù)早已大顯身手。對(duì)普通家庭而言,老照片修復(fù)工具成為喚醒珍貴記憶的關(guān)鍵。即夢(mèng) AI 操作便捷,用戶只需上傳照片,輸入諸如 “去除劃痕”“恢復(fù)色彩” 等簡(jiǎn)單指令關(guān)鍵詞,短短幾分鐘,照片上的瑕疵便會(huì)消失不見,曾經(jīng)模糊的親人面容重新清晰可辨,兒時(shí)的歡樂場(chǎng)景也再度鮮活起來。而 ComfyUI 更擅長(zhǎng)處理破損嚴(yán)重的老照片,它允許用戶通過節(jié)點(diǎn)配置精細(xì)調(diào)整修復(fù)區(qū)域,哪怕照片已被撕裂成幾部分,經(jīng)過專業(yè)的參數(shù)設(shè)置,也能實(shí)現(xiàn)完美復(fù)原。在文化遺產(chǎn)保護(hù)領(lǐng)域,山西永樂宮壁畫的修復(fù)堪稱經(jīng)典范例。歷經(jīng) 800 多年的風(fēng)雨洗禮,永樂宮壁畫出現(xiàn)大面積褪色、脫落等問題。

AMD、永樂宮和生數(shù)科技攜手合作,借助生成式 AI 技術(shù),訓(xùn)練出 “元代 AI 畫師”。AI 系統(tǒng)通過對(duì)壁畫進(jìn)行精密掃描和數(shù)據(jù)解構(gòu),深入分析其在歷史變遷中遭受的損壞,耗時(shí)近一年,讓壁畫中的線條重新流暢自然,色彩再度絢麗奪目。修復(fù)后的壁畫,人物眼神靈動(dòng),姿態(tài)栩栩如生,吸引無數(shù)游客慕名而來,讓這一古老藝術(shù)瑰寶重新綻放耀眼光芒。不僅如此,在影視行業(yè),它助力老舊膠片電影擺脫劃痕與噪點(diǎn)的困擾,以高清畫質(zhì)重登大銀幕;在考古現(xiàn)場(chǎng),它協(xié)助專家還原破損文物上的圖案,為解讀古代文明提供關(guān)鍵線索;在醫(yī)療領(lǐng)域,它增強(qiáng)醫(yī)學(xué)影像的清晰度,輔助醫(yī)生更精準(zhǔn)地診斷病情。

從更深層次的文化意義考量,生成式 AI 圖像修復(fù)技術(shù)堪稱守護(hù)人類文明的 “數(shù)字衛(wèi)士”。它使瀕臨消逝的文化遺產(chǎn)影像得以永久保存,將歷史的記憶深深鐫刻在數(shù)字世界,為后人了解先輩的智慧與創(chuàng)造力搭建起堅(jiān)實(shí)橋梁。當(dāng)破損的老照片被修復(fù),泛黃的全家福重現(xiàn)清晰,那些被歲月塵封的情感與故事也隨之復(fù)蘇,成為維系家族情感的重要紐帶。對(duì)于藝術(shù)家而言,修復(fù)后的老照片、壁畫等,蘊(yùn)含著獨(dú)特的歷史美學(xué)和藝術(shù)風(fēng)格,為他們的創(chuàng)作注入源源不斷的靈感,推動(dòng)藝術(shù)在傳統(tǒng)與現(xiàn)代的交融中不斷創(chuàng)新發(fā)展 。

圖源:AI生成

不過,這項(xiàng)神奇的技術(shù)并非無懈可擊。在面對(duì)一些破損極為嚴(yán)重且缺乏足夠參考信息的圖像時(shí),AI 可能會(huì) “判斷失誤”,生成與原始內(nèi)容不符的畫面。不同類型和風(fēng)格的圖像,也給修復(fù)模型的通用性帶來挑戰(zhàn),一種模型或許在某類圖像上表現(xiàn)優(yōu)異,面對(duì)其他圖像時(shí)卻效果欠佳。此外,運(yùn)行 AI 修復(fù)模型需要強(qiáng)大的計(jì)算資源,較高的成本在一定程度上限制了其在部分場(chǎng)景的廣泛應(yīng)用。同時(shí),修復(fù)過程中的倫理問題也不容忽視,比如在修復(fù)文化遺產(chǎn)時(shí)如何維持其原真性,修復(fù)后圖像的版權(quán)歸屬等,都是亟待解決的難題 。

正如第二十七屆中國(guó)科協(xié)年會(huì)所強(qiáng)調(diào)的“示蹤科技前沿 助力創(chuàng)新發(fā)展”,生成式 AI 圖像修復(fù)技術(shù)正是這一理念的生動(dòng)實(shí)踐。隨著技術(shù)的迅猛發(fā)展和相關(guān)規(guī)范的逐步完善,我們有充分理由相信,未來的生成式 AI 圖像修復(fù)技術(shù)將朝著更智能、更精準(zhǔn)的方向大步邁進(jìn)。它將走進(jìn)更多領(lǐng)域,在智能安防中助力還原監(jiān)控畫面,在虛擬現(xiàn)實(shí)里構(gòu)建逼真的歷史場(chǎng)景,持續(xù)用 “魔法” 修復(fù)時(shí)光,為我們帶來更多意想不到的驚喜與感動(dòng),也必將在科技創(chuàng)新與文化傳承融合的道路上,書寫更加精彩的篇章。

供稿單位:重慶理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院

作者:重慶理工大學(xué) 高文潔

審核專家:倪偉

聲明:除原創(chuàng)內(nèi)容及特別說明之外,部分圖片來源網(wǎng)絡(luò),非商業(yè)用途,僅作為科普傳播素材,版權(quán)歸原作者所有,若有侵權(quán),請(qǐng)聯(lián)系刪除。

來源: 重慶市科學(xué)技術(shù)協(xié)會(huì)

內(nèi)容資源由項(xiàng)目單位提供