2025年7月24日,上海創智學院舉行成果發布會,首發8項前沿創新成果,涵蓋認知智能、情境智能、具身智能、科學智能、基礎設施等多個人工智能核心領域。
三大智能核心突破,讓“不可能”變成“可能”
當機器學會思考、理解環境和作用于物理世界,認知智能、情境智能與具身智能正書寫新標準,推動AI成為改變世界的真實力量。上海創智學院重磅發布“Q計劃-深度認知引擎”“面向情境智能的擬人化語音交互模型”及“數字基因”,彰顯其在三大智能領域的引領性突破。
認知智能:跨越邊界的思維革命
認知能力的躍升將突破AI的工具屬性邊界,使其思考時間從秒級延展至小時、月甚至年級,重構人工智能的極限。劉鵬飛團隊為此貢獻三大核心成果:發布全球首部《認知工程》白皮書奠定理論基石;創新提出Mid-training認知訓練范式,并開源史上最大科學推理數據集MegaScience(基于超萬本高質量教科書)及700億認知語料;打造全球首個認知積累AI平臺——Deep Cognition。這標志著AI從“對話交互”邁向“認知協作”的革命性轉變。
情境智能:擬人交互的終極想象
實現基于情境的自然交互是智能體的關鍵目標。邱錫鵬團隊聯合復旦、模思智能OpenMOSS團隊,發布“面向情境智能的擬人化語音交互模型”MOSS-Audio。該模型突破行業“恐怖谷效應”與多角色對話生硬瓶頸,通過深度理解完整對話情境,實現超高擬人度、自然流暢的多角色語音合成,精準復現音色、語氣與韻律變化,性能業界領先,已應用于AI播客制作。MOSS-Audio融合大模型推理與深度語境感知,為“情境智能”奠定基石。
具身智能:萬物操作的通用“說明書”
理解并操作萬物需克服數字孿生難以規模化的瓶頸。受生物基因啟發,盧策吾團隊全球首創“數字基因”,構建可解析的通用具身操作世界觀,堪稱“真實世界的Alphafold”。它替代傳統數字孿生,解析海量物體操作規則,首次攻克“感知-程序”大模型難題,解決機器人操作不可泛化與規模化困境。開源1億帶操作的高質量數據資產(目標10億),旨在打造具身智能產業的“北斗”級基礎設施,賦能機器人未來如人般操作與鏈接萬物。
三大技術基座創新,從創造可能到實現價值
基礎設施是驅動智能時代進化的引擎,為產業應用提供穩定、可擴展的底層支撐。
終端突破:破解“不可能三角”
終端面臨“能效-空間-智能”的固有難題。戴國浩團隊發布終端本征大模型“Megrez 2.0 Preview版”。它以僅3B的實際計算量,實現媲美21B模型的智能水平,內存需求卻低至7B規模的INT4量化(<4G),廣泛適配各類終端。實測性能顯著領先:比同內存模型快50%,比同尺寸稠密模型精度高20%,比同精度模型省內存60%。其創新設計利用設備“休眠時段”持續創造價值,賦予終端更強能動性。
開源基石:釋放AI潛能
為打破閉源壟斷,上海創智學院打造創智自主智算系統,發布面向下一代推理的強化學習開源框架siiRL,建設最適合未來模型的AI基礎設施,成為“開源infra”。siiRL具備完全分布式設計(可擴展至千卡/萬卡)、模塊化架構(支持多智能體協同),并兼容多款國產芯片。性能上,siiRL全場景領先主流框架,尤其在多模態和長下文場景效率快2-7倍。該框架已100%開源,目標實現“大模型跑在中國芯,AGI基石全球共享”。
教育基建:賦能教育系統變革
如今,AI 使得人才的培養與選拔都可能發生根本性的變革,教育大模型相關技術長期被國際巨頭壟斷。周愛民團隊推出的 “啟創?InnoSpark 1.0” 力圖改善這一現象,打造有中國特色的教育基座大模型。該模型基于國產千問基座自研,深度聚焦教育場景,解答教育問題,賦能學科教研,助力實現教學育人一體化。相比通用大模型,“啟創?InnoSpark”在塑造正確價值觀、培養創新思維、實現因材施教方面優勢顯著,預計今年9月正式公開對外提供服務。
輻射多個領域,探索科技普惠之路
朱通團隊發布“面向能源化工的原子級基座模型”,破解煤炭高效精準轉化難題。該模型深入理解化學反應規律,實現反應路徑秒級預測及譜學信號與機理雙向對齊,已與國能集團合作取得應用進展。
上海創智學院2024級博士生趙欣彥代表團隊發布“萬物有靈”具身智能項目,提出打造“硬件中的大模型”核心理念。通過可重構模塊單元(獨立功能,協同組合),構建適應復雜任務的新形態機器人。已探索“宏原子”模塊化、驗證“管水母”自主變形能力,類人伙伴“創智龍”將于9月發布。項目由創智學院多學科團隊推動。
來源: 上海創智學院