2025年7月24日,上海創(chuàng)智學(xué)院舉行成果發(fā)布會(huì),首發(fā)8項(xiàng)前沿創(chuàng)新成果,涵蓋認(rèn)知智能、情境智能、具身智能、科學(xué)智能、基礎(chǔ)設(shè)施等多個(gè)人工智能核心領(lǐng)域。
三大智能核心突破,讓“不可能”變成“可能”
當(dāng)機(jī)器學(xué)會(huì)思考、理解環(huán)境和作用于物理世界,認(rèn)知智能、情境智能與具身智能正書寫新標(biāo)準(zhǔn),推動(dòng)AI成為改變世界的真實(shí)力量。上海創(chuàng)智學(xué)院重磅發(fā)布“Q計(jì)劃-深度認(rèn)知引擎”“面向情境智能的擬人化語(yǔ)音交互模型”及“數(shù)字基因”,彰顯其在三大智能領(lǐng)域的引領(lǐng)性突破。
認(rèn)知智能:跨越邊界的思維革命
認(rèn)知能力的躍升將突破AI的工具屬性邊界,使其思考時(shí)間從秒級(jí)延展至小時(shí)、月甚至年級(jí),重構(gòu)人工智能的極限。劉鵬飛團(tuán)隊(duì)為此貢獻(xiàn)三大核心成果:發(fā)布全球首部《認(rèn)知工程》白皮書奠定理論基石;創(chuàng)新提出Mid-training認(rèn)知訓(xùn)練范式,并開源史上最大科學(xué)推理數(shù)據(jù)集MegaScience(基于超萬(wàn)本高質(zhì)量教科書)及700億認(rèn)知語(yǔ)料;打造全球首個(gè)認(rèn)知積累AI平臺(tái)——Deep Cognition。這標(biāo)志著AI從“對(duì)話交互”邁向“認(rèn)知協(xié)作”的革命性轉(zhuǎn)變。
情境智能:擬人交互的終極想象
實(shí)現(xiàn)基于情境的自然交互是智能體的關(guān)鍵目標(biāo)。邱錫鵬團(tuán)隊(duì)聯(lián)合復(fù)旦、模思智能OpenMOSS團(tuán)隊(duì),發(fā)布“面向情境智能的擬人化語(yǔ)音交互模型”MOSS-Audio。該模型突破行業(yè)“恐怖谷效應(yīng)”與多角色對(duì)話生硬瓶頸,通過(guò)深度理解完整對(duì)話情境,實(shí)現(xiàn)超高擬人度、自然流暢的多角色語(yǔ)音合成,精準(zhǔn)復(fù)現(xiàn)音色、語(yǔ)氣與韻律變化,性能業(yè)界領(lǐng)先,已應(yīng)用于AI播客制作。MOSS-Audio融合大模型推理與深度語(yǔ)境感知,為“情境智能”奠定基石。
具身智能:萬(wàn)物操作的通用“說(shuō)明書”
理解并操作萬(wàn)物需克服數(shù)字孿生難以規(guī)模化的瓶頸。受生物基因啟發(fā),盧策吾團(tuán)隊(duì)全球首創(chuàng)“數(shù)字基因”,構(gòu)建可解析的通用具身操作世界觀,堪稱“真實(shí)世界的Alphafold”。它替代傳統(tǒng)數(shù)字孿生,解析海量物體操作規(guī)則,首次攻克“感知-程序”大模型難題,解決機(jī)器人操作不可泛化與規(guī)模化困境。開源1億帶操作的高質(zhì)量數(shù)據(jù)資產(chǎn)(目標(biāo)10億),旨在打造具身智能產(chǎn)業(yè)的“北斗”級(jí)基礎(chǔ)設(shè)施,賦能機(jī)器人未來(lái)如人般操作與鏈接萬(wàn)物。
三大技術(shù)基座創(chuàng)新,從創(chuàng)造可能到實(shí)現(xiàn)價(jià)值
基礎(chǔ)設(shè)施是驅(qū)動(dòng)智能時(shí)代進(jìn)化的引擎,為產(chǎn)業(yè)應(yīng)用提供穩(wěn)定、可擴(kuò)展的底層支撐。
終端突破:破解“不可能三角”
終端面臨“能效-空間-智能”的固有難題。戴國(guó)浩團(tuán)隊(duì)發(fā)布終端本征大模型“Megrez 2.0 Preview版”。它以僅3B的實(shí)際計(jì)算量,實(shí)現(xiàn)媲美21B模型的智能水平,內(nèi)存需求卻低至7B規(guī)模的INT4量化(<4G),廣泛適配各類終端。實(shí)測(cè)性能顯著領(lǐng)先:比同內(nèi)存模型快50%,比同尺寸稠密模型精度高20%,比同精度模型省內(nèi)存60%。其創(chuàng)新設(shè)計(jì)利用設(shè)備“休眠時(shí)段”持續(xù)創(chuàng)造價(jià)值,賦予終端更強(qiáng)能動(dòng)性。
開源基石:釋放AI潛能
為打破閉源壟斷,上海創(chuàng)智學(xué)院打造創(chuàng)智自主智算系統(tǒng),發(fā)布面向下一代推理的強(qiáng)化學(xué)習(xí)開源框架siiRL,建設(shè)最適合未來(lái)模型的AI基礎(chǔ)設(shè)施,成為“開源infra”。siiRL具備完全分布式設(shè)計(jì)(可擴(kuò)展至千卡/萬(wàn)卡)、模塊化架構(gòu)(支持多智能體協(xié)同),并兼容多款國(guó)產(chǎn)芯片。性能上,siiRL全場(chǎng)景領(lǐng)先主流框架,尤其在多模態(tài)和長(zhǎng)下文場(chǎng)景效率快2-7倍。該框架已100%開源,目標(biāo)實(shí)現(xiàn)“大模型跑在中國(guó)芯,AGI基石全球共享”。
教育基建:賦能教育系統(tǒng)變革
如今,AI 使得人才的培養(yǎng)與選拔都可能發(fā)生根本性的變革,教育大模型相關(guān)技術(shù)長(zhǎng)期被國(guó)際巨頭壟斷。周愛(ài)民團(tuán)隊(duì)推出的 “啟創(chuàng)?InnoSpark 1.0” 力圖改善這一現(xiàn)象,打造有中國(guó)特色的教育基座大模型。該模型基于國(guó)產(chǎn)千問(wèn)基座自研,深度聚焦教育場(chǎng)景,解答教育問(wèn)題,賦能學(xué)科教研,助力實(shí)現(xiàn)教學(xué)育人一體化。相比通用大模型,“啟創(chuàng)?InnoSpark”在塑造正確價(jià)值觀、培養(yǎng)創(chuàng)新思維、實(shí)現(xiàn)因材施教方面優(yōu)勢(shì)顯著,預(yù)計(jì)今年9月正式公開對(duì)外提供服務(wù)。
輻射多個(gè)領(lǐng)域,探索科技普惠之路
朱通團(tuán)隊(duì)發(fā)布“面向能源化工的原子級(jí)基座模型”,破解煤炭高效精準(zhǔn)轉(zhuǎn)化難題。該模型深入理解化學(xué)反應(yīng)規(guī)律,實(shí)現(xiàn)反應(yīng)路徑秒級(jí)預(yù)測(cè)及譜學(xué)信號(hào)與機(jī)理雙向?qū)R,已與國(guó)能集團(tuán)合作取得應(yīng)用進(jìn)展。
上海創(chuàng)智學(xué)院2024級(jí)博士生趙欣彥代表團(tuán)隊(duì)發(fā)布“萬(wàn)物有靈”具身智能項(xiàng)目,提出打造“硬件中的大模型”核心理念。通過(guò)可重構(gòu)模塊單元(獨(dú)立功能,協(xié)同組合),構(gòu)建適應(yīng)復(fù)雜任務(wù)的新形態(tài)機(jī)器人。已探索“宏原子”模塊化、驗(yàn)證“管水母”自主變形能力,類人伙伴“創(chuàng)智龍”將于9月發(fā)布。項(xiàng)目由創(chuàng)智學(xué)院多學(xué)科團(tuán)隊(duì)推動(dòng)。
來(lái)源: 上海創(chuàng)智學(xué)院