01 “數智化”是必然趨勢具體來看,人類的生產生活行為一般可以分為三個步驟。第一個步驟叫感知,就是通過耳、鼻、眼等器官,多維度感知這個世界的信息。第二個階段叫決策,就是利用大腦,基于感知到的信息,決定要干什么事情。第三個是行動,你的手和腳,去做出一個動作。而信息科技的發展,其實就是人類的“懶基因”作用下,不斷讓機器解放人類生產生活的過程。最早的信息化,機器開始助力人類完成感知工作。1950 年問世的 ENIAC 通用計算機,每秒能進行 5000 次加法運算,而人類每秒極限僅 5 次加法運算,其將人類計算速度提升了 1000 倍,極大地提高了人類感知速度,但決策和行動仍由人類完成。然后到2000年上下的數字化階段,借助大數據技術與決策式人工智能,機器已能完成部分決策工作。例如谷歌利用 hadoop 框架,每秒可處理上億條音視頻等數據,打破了人類感知速度的局限。同時,人工智能圍棋選手 Alphago 戰勝柯潔,意味著機器在部分領域可模擬、輔助乃至超越人類行為,人類在部分場景下只需做最終判斷與行動即可。**再到當前的數智化時代,機器能在大部分領域模擬甚至超越人類。**像 ChatGPT 在律師資格考試、綜合類高考、醫療資格考試、計算機考試等多領域評估模型下,成績超過 90% 的人類,人類在多數場景下只需付諸行動就行。
02 “數字化”和“數智化”三大區別“數智化” 與 “數字化” 雖僅一字之差,卻在目標、資源、技術三方面存在顯著區別,具體如下:第一是關鍵目標不同,“數字化” 階段,機器主要是有力支撐人類角色與行動,比如通過報表、大屏等形式將梳理、探索的內容展示出來;而 “數智化” 階段的關鍵目標在于實現機器對人類行為的高度模擬乃至超越,全面覆蓋決策與行動,實現了較大躍升。第二是關鍵資源不同,數字化企業的關鍵資源是數據,數智化企業的關鍵資源則是數據要素。數據作為人工智能發展三要素之一,數據要素與傳統數據資源的區別在于它是多元數據的融合,并非局限于單一企業內部數據,而是可通過數據交易所、授權運營等方式從外部獲取數據并融合,使其成為關鍵資源,這也致使數據的采集、存儲、管理方式都發生了巨大變化。第三是關鍵技術的不同,數字化企業側重于大數據、云計算等技術,數智化企業與之最大的區別在于生成式人工智能,并非僅局限于決策式人工智能。正如黃仁勛在 GTC 2024 所言 “generative is future(生成式才是未來)”。除生成式人工智能技術外,數據要素技術、區塊鏈、互聯網、算力網等數智技術也都迎來了新的變革與應用。
03 完成“數智化”轉型,企業要做好五項工作****1)構建企業數據智能基礎設施數智化企業對基礎設施產生了一些新的需求。其一,多元數據的采集、存儲與計算出現顯著變化,關鍵在于如何讓基礎設施支持其快速接入、訓練及推理,涵蓋內部與外部數據,內部數據有限而外部數據量龐大,需思考怎樣高效引入外部數據。其二,關注數據與智能平臺的高效連接,主要體現于訓練和推理兩方面。在訓練階段,要探索如何借助數據基礎設施實現加速;在推理方面,則需考慮怎樣引入RAG(知識增強檢索系統)來彌補模型存在的缺陷。其三,重視異構算力平臺的有效調度,涉及CPU、GPU、DPU、APU等類型以及X86、arm、power等體系,以此達成高效計算。 目前業內關于這個領域的發展包括:一是發展應用向量數據庫,從而加速模型訓練和推理。向量數據庫可有效助力各類特征處理工作,進而支撐人工智能模型的訓練與推理。隨著人工智能不斷發展,未來向量數據庫有望如關系型數據庫一般,成為每個企業的標配。目前國內已有十多款向量數據庫。 二是利用湖倉一體,實現多元數據的管理和計算。湖倉一體可便捷實現異構數據的管理與應用,目前已在部分大型金融機構和運營商處落地。 三是智能存儲,降低訓練數據存儲成本。人工智能的訓練與推理會產生高額的數據存儲成本,致使許多企業難以承受。智能存儲作為降低數據存儲成本的有效技術手段,目前已被多數云廠商推出。 四是數據流通平臺,實現企業內外部的數據融合匯聚。目前,國內以隱私計算為代表的數據流通技術產品已有數百款。五是研發應用數據智能平臺,一體化數據處理與模型訓練過程。國際上發展勢頭迅猛,Databricks于去年推出LakehouseAI,且持續收購智能訓練公司。Snowflake深度支持英偉達GPU基礎設施,諸多平臺針對英偉達GPU進行了專門優化。Oracle宣布推出新一代數據、分析和AI平臺——Fusion Data Intelligence Platform,并與英偉達建立了更為緊密的合作伙伴協定。 2)打造企業數據智能中臺數據中臺是在2018年左右,由阿里巴巴從國外引入,并于國內經過演化發展形成的一套理論與技術方法論。然而,依據DIKW(data,information,knowledge,wise)四層衍生體系來分析,僅依靠數據中臺是不足夠的。在這四層中,除了最底層的data、information兩層外,處于上層的knowledge,是在數據智能時代背景下,企業需要著重打造的一層公共服務。基于此,我們做出如下研判。未來企業應建設數據智能中臺,主要包含三個部分,一是數據中臺,實現數據的匯聚和打通;二是知識中臺,從數據中提取知識,對所提取的知識展開進一步歸因與分析。 三是智能中臺,如何借助中臺,將智能相關內容輸送至各業務線,避免僅將其置于人工智能部門、算法部門,使其作為獨立個體去開展測試工作。 3)實現企業數據智能的治理和安防數據和智能的發展,為前期的治理和安全防框架帶來諸多新挑戰。例如,亟待建立人工智能的數據治理體系、面向AI的數據質量評價體系、面向人工智能的數據工程體系、大模型生命周期及數據安全意義保護的能力,以及合規合成數據生產內容管理框架等。 4)開發企業的數據智能應用數據智能應用是傳統數據應用,在數據智能技術和方法論加持下的升級。其一,應用技術升級。借助智能降低技術門檻,例如大模型賦能的BI工具,通過自然語言交互方式,使BI工具的使用難度降低,推動技術趨向平面化。其二,應用流程變革。運用智能完成應用過程,像利用文生圖、文生視頻等智能技術重塑營銷設計、客戶運營工作,這致使大量海報、設計公司受到較大沖擊,同時也極大地促進了企業的營銷工作。其三,利用智能改變應用業態。比如借助數字人實現定制化的明星播報與關懷,讓心儀的明星為自己定制服務,進而提升各類應用的競爭格局。 5)形成企業數據智能的保障機制具體涵蓋兩方面內容:一個是數據智能的人才培養,主要涉及三類人才,分別是數智管理人才、數智應用人才以及數智專業技術人才。二是企業的組織模式,即怎樣推動業務、數據、技術三個部門深度融合。
來源: 數據資產學堂