近日,甲骨易接連在大模型和AI領域取得新的工作進展和成果,受到工信部和中國信通院的認可,甲骨易董事長姜征榮幸成為中國信通院人工智能關鍵技術與應用評測工業和信息化部重點實驗室專家委員,同時,甲骨易還成為了信通院發布的大模型基準測試體系“方升”首批合作伙伴。

成為中國信通院人工智能關鍵技術與應用評測工業和信息化部重點實驗室專家委員

近年來我國人工智能產業發展勢頭迅猛,人工智能核心產業規模已達 5000 億元人民幣,企業數量超過 4400 家,為建設數字強國注入了強大的生命活力。

2017年10月初,工業和信息化部正式批復中國信息通信研究院承建人工智能關鍵技術與應用評測工業和信息化部重點實驗室(下稱實驗室)。2022年7月,實驗室順利通過工信部重點實驗室五年考核,被工信部認定為“標準評測及知識產權服務平臺”,并獲得了人工智能產業創新揭榜優勝單位稱號。

人工智能關鍵技術重點實驗室2023年學術委員合影

為進一步落實國家戰略布局以及工信部關于人工智能產業的相關決策和部署,加強實驗室建設管理水平,以產學研融合促進行業發展,實驗室決定籌備新一屆學術委員會,甲骨易董事長姜征先生被光榮聘請為實驗室學術委員會專家委員。

甲骨易董事長姜征先生受聘實驗室學術委員會專家委員

甲骨易是業內語言+AI服務數字先行者,在智能化浪潮中迎頭而上,緊跟時代發展和國家決策要求,以高質量數據成果助力夯實AI技術底座,提升人工智能在各行業的深度融合與落地應用。

成為中國信通院大模型基準測試體系“方升”首批合作伙伴

為滿足大模型產業化落地選型測試和能力監測需求,中國信通院于"2024中國信通院ICT深度觀察研究成果報告會"上發布大模型評測體系"方升",旨在建立業界大模型基準測試統一的"度量衡",規范大模型產業發展。

甲骨易是中國信通院“方升”大模型基準測試首批合作伙伴,攜手共建“通用幻覺基準測試集”,獲得中國信通院“大模型基準測試體系合作伙伴”證書,共同致力于加快構適產業界適用于中文大模型全面、客觀、統一、規范的大模型基準測試體系。

甲骨易成為中國信通院“方升”大模型基準測試體系首批合作伙伴

中國信通院稱,“方升”能夠合理解決模型評測規則混亂、距離應用場景較遠等亟待解決的問題,從四個維度對大模型進行全面、客觀、統一的評估?!胺缴睖y試體系測試體系搭建動態測試數據庫,涵蓋測試數據集107個,測試數據條數達到123萬。此次中國信通院聯合甲骨易等產業界多家機構首次推出面向行業、通用、應用、安全領域的評測數據集6個,使中文大模型能更好地產業智能化落地,加速大模型與產業融合。

甲骨易董事長姜征先生出席報告會

隨著大模型快速發展,其帶來的真假難辨的“幻覺”和虛假信息難以檢測等影響大模型落地的問題一直被人們關注。甲骨易在深入布局全球智能語言服務生態的同時,將全球多語言本地化能力平移到數據服務領域,成立甲骨易AI研究院(甲骨易AI Lab),推出中文大模型評測體系LucyEval,在全球業內率先發布基于中文多任務理解能力測試集,后續再次首發中文大模型多學科生成能力評測,開創性地將大模型成熟度評測維度從通識評測轉向業務場景評測,通過深化對中文大模型的能力評測,幫助中文大模型提升全球競爭力。

甲骨易獲得中國信通院“大模型基準測試體系合作伙伴”證書

在發布LucyEval時甲骨易就曾表示:“如何最快速地判斷機器是否能正確理解人類的知識和語言是我們共同關注的問題。甲骨易AI研究院希望通過LucyEval對模型各方面能力的客觀測試,找到模型的不足,幫助設計者和工程師更加精準地調整、訓練模型,助力大模型不斷邁向更智能的未來。”

甲骨易始終堅持以高質量數據加快模型在應用場景下的智能化進程,以人工智能關鍵技術作為企業數字化轉型的核心驅動力。甲骨易堅信通過此次與中國信通院聯合發布的幻覺基準測試集,能夠幫助中文大模型更好地對抗幻覺,實現真正的人模共生。

來源: 全球科技動態