今天分享的主題是把握 AI 大模型引發的時代機遇,主要包括以下內容:第一,什么是 AI 大模型的本質?演進路線是什么?第二,為什么當今被稱為“智能時代”?第三,如何把握這一百年難遇的機會?
AI 大模型發展的政策背景與行業趨勢
4月25日,中共中央政治局就加強人工智能發展和監管進行集體學習,提出充分發揮新型舉國體制優勢、堅持自立自強、突出應用導向、健康有序發展等關鍵詞。
2025年的兩會報告中,大模型首次被寫入,同時涉及優化全國算力資源布局、發展新一代智能終端、低空經濟、生物制造、具身智能、平臺經濟以及重視青年科技人才等內容,均圍繞數字經濟發展,凸顯應用導向。
美國方舟基金創始人凱瑟利·伍德發布的“2025 大膽設想”,與我國兩會報告在 AI Agent、無人駕駛出租車、低空經濟等方面存在高度共識。美國這一報告預測全球 GDP 增長將因新興產業發展顯著提升,人工智能將在其中占據主導地位。
AI 大模型的發展歷程與技術演進
從 AI 的起源來看,1950 年圖靈提出圖靈測試,1956 年人工智能學科誕生。早期受技術限制,基于規則的專家系統因難以實現標準化規則而受限;隨后從棋類游戲方向突破,基于概率統計的機器學習取得一定成果,但在圍棋領域遭遇瓶頸。
1. 深度學習與 AlphaGo:2013 年,基于神經網絡的深度學習誕生,其將 GPU 計算特征與神經網絡結合,造就了 AlphaGo 戰勝世界冠軍李世石的壯舉。然而,AlphaGo 僅為專屬模型,只能下圍棋,應用局限性導致其逐漸淡出人們視野。
2. Transformer 架構與通用模型:2017 年,谷歌發布 Transformer 底層架構,通過預訓練大量無標注數據,使模型具備通用性,能夠適配多種任務。這一架構成為 ChatGPT 等眾多 AI 模型的基礎,開啟了生成式 AI 階段,使 AI 具備推理和判斷能力,推動 AI 發展進入新階段。
AI 大模型的定義與核心
1. 知識獲取新范式:AI 大模型是人類獲取知識的新范式,其地位與文字、互聯網相當。過去,人類通過書籍、互聯網獲取知識,如今知識體系被訓練到大模型中,人們通過與模型交互獲取答案,如 ChatGPT 能回答各種問題、進行創意寫作、編程等,改變了知識獲取和應用的方式。
2. ChatGPT 的引領作用:ChatGPT 作為 AI 大模型的首個現象級產品,將 GPT 模型與 chat 交互環境結合,“G” 代表生成式,“P” 代表預訓練,基于 Transformer 算法,展現出強大的功能。它的出現標志著 AI 大模型能力的充分發揮,促使 AI 搜索逐漸搶占傳統搜索市場份額,如谷歌搜索流量增長遇阻,而微軟將 ChatGPT 與搜索引擎結合后實現增長。
AI 大模型的特性與廣泛應用
在軟件領域,AI 大模型將重構軟件系統,使軟件具備 AI 能力,如 WPS、釘釘、飛書等軟件紛紛融入 AI 功能;硬件方面,驅動自動駕駛汽車、智能工廠機械臂等發展;數據層面,激活數據價值,使其成為重要生產要素。
在實際應用中,AI 大模型已滲透到奧運轉播(如實現快速圖像實時處理和 3D 渲染)、電商(助力商品推薦、營銷、客服等)、醫療(多癌早篩、加速藥物研發)、生產制造(智能決策、優化生產流程)等眾多領域,提升各行業效率與創新能力。
AI 大模型的技術本質與演進邏輯
AI 大模型是人類社會第 25 種通用技術?;仡櫱懊?24 種通用技術,包括鐵路、內燃機、電力、計算機、互聯網等,會發現每一種通用技術都推動了時代的變革。計算機推動了計算革命,互聯網推動了互聯網革命,電力引發了電氣革命,內燃機促進了工業革命。這些通用技術具有四個重要特征:其一,在多個領域廣泛使用,區別于僅解決單一問題的專用技術;其二,能夠與其他技術互補,并非獨立存在;其三,具備降本增效功能,降低門檻、減少成本并提高生產效率,帶來顛覆性的生產力提升;其四,會對組織方式產生變革性影響 。
各類通用目的技術達到臨界應用水平(即一半以上的人都在使用該技術)所需時間各不相同。電用了 37 年,起初電的持續使用成本很高,例如鋪設電線點亮燈泡,一天可能需要一到兩美金,而同樣能在夜間照明的蠟燭成本更低,因此電實現臨界應用水平需滿足兩個關鍵點:**技術好用且足夠便宜,實現普惠。**當用電成本遠低于蠟燭時,電不僅用于點燈,還被應用于電冰箱、面包機等,從而實現普及。個人電腦達到臨界應用水平用了 23 年,智能手機用了 21 年,互聯網用了 17 年,而 GPT 僅用了十個月。這充分說明 GPT 好用且價格親民,大幅提升了生產力。
**AI 大模型的通用性遵循規模定律,即模型的參數越大,預訓練數據集越多,模型的性能越好。**參數可理解為模型學到的知識,這些知識通過數據表征,以向量的方式呈現每個知識點。例如人的身高、體重、性別、頭發顏色等特征,通過數字計算實現關聯權重。以 “浙江省科普聯合會” 為例,“科” 與 “普” 的組合,以及 “科普” 與 “聯合會” 的組合,都存在關聯度和權重,這就是參數的體現。從數學角度看,參數就類似函數中用于更好匹配輸入與輸出信息的系數,參數越多,準確度越高。
此外,AI 大模型本身是深度神經網絡的模型架構,從生物理論來講,大腦皮層的神經元數量與通用水平成正比。人類擁有 900 億個神經元,屬于通用型大腦;狗有 22 億個神經元,是專用性大腦,狗出生一年后,肌肉發達、嗅覺靈敏,到三、四、五歲基本能力無明顯增加,因其神經元決定了它只能做專屬任務;而人類一歲時還只能爬,但后續能學會說話、走路、學習各種知識,正是 900 億神經元賦予了人類通用性,使人多才多藝、有記憶力、具備推理能力,由此也能更好地理解 AI 大模型的參數與規模定律。
AI 大模型有兩個核心魔力。****
**第一個是涌現性。**隨著模型參數數量達到一定規模,模型在各項能力上會出現迅猛提升,從線性增長轉變為指數級增長。例如孩子學習數學,做 100 道題可能仍無明顯進步,但做到 1100~1200 道題時,突然開竅,所有題目都會做,這便是量變到質變的過程。在 AI 大模型中,無論是文字理解、修飾手法運用、數學邏輯推導還是國際音標撰寫等方面,都會出現這種涌現現象,再次印證了規模定律,即模型參數規模越大,訓練數據集規模越大,模型性能越好。
第二個魔力是泛化性,即模型的學習能力,它能夠對從未見過的數據進行良好處理,且表現專業。
模型的發展演進經歷了不同階段。最初是 “一事一?!?階段,通過簡單的專屬模型實現機器翻譯、語音轉錄、人臉識別、指紋識別等單一任務,每個模型只能完成特定一件事,若要解決其他問題,需重新尋找模型并訓練數據。
后來進入 “多事一模” 階段,嘗試將人臉識別、豬臉識別、狗臉識別等任務整合到一個模型中,該模型具備跨領域知識,能夠完成多個不同任務。在這個過程中,專屬模型精度高,參數增加后會獲得泛化能力,但精度有所下降。為解決這一問題,需不斷加大參數和數據集規模,使模型兼具泛化性和高精度。
最終目標是實現 “萬事一?!?,即一個模型能解決人類認知中的所有任務,此時模型具備推理能力、多模態融合能力以及規劃和執行能力,真正實現通用人工智能。事實上,AI 大模型正逐步接近人類專家水平,2017 年達到基礎閱讀理解能力,2021 年具備視覺推理能力,2023 年擁有多元認知能力,到 2025 年,已能夠解決復雜推理問題,比如完成奧數題目。
中美 AI 大模型競爭格局與中國產業生態
1. 中美競爭態勢:在大模型賽道,中美呈現不同競爭格局。語言大模型方面,中國從追趕逐步發展;推理模型中,中國與美國并駕齊驅,如中國的 R1 推理模型與 OpenAI 的相關模型不分上下;多模態模型領域,中國因注重業務場景應用,處于領跑地位。
2. 中國產業生態優勢:中國 AI 大模型產業圖譜涵蓋應用端和基礎設施端?;A設施端包括硬件、數據治理、模型和工具層,培育出眾多龍頭和獨角獸企業;應用端廣泛涉及辦公、營銷、創意等領域。以杭州為例,其 AI 企業成功得益于開源開放生態,包括政策支持、資本投入、人才培養、良好營商環境,以及產學園融合和豐富的數字化場景應用,為 AI 發展提供了肥沃土壤。
以杭州為例,其成功發展 AI 產業得益于開源開放的生態,包括政策支持、資本投入、人才培養和良好的營商環境,以及產學研融合和豐富的數字化場景應用??萍紕撔虏荒芴善剑髽I需不斷創新,如特斯拉的端到端大模型取代傳統規則系統,以及具生智能模型提升產品附加值,體現了技術創新和賦能的重要性。個人也應擁抱 AI,用好 AI 工具包,提升自身 AI 素養,積極融入智能時代。
把握 AI 時代機遇的關鍵舉措
1. 科技創新的重要性:科技創新沒有絕對的護城河,企業需持續創新。如特斯拉采用端到端大模型改進自動駕駛技術,摒棄傳統規則系統;企業通過將 AI 大模型與產品結合實現技術賦能,如掃地機結合 AI 大模型后,售價大幅提升且節省人工成本,展現出科技創新帶來的巨大競爭力。
2. 個人與時代的共成長:身處智能時代,個人應積極擁抱 AI,使用 AI 工具包提升自身 AI 素養。隨著模型迭代和工具優化,個人需不斷學習適應。
最后引用我們馬老師的一段話作結:“電剛剛發明的時候,唯一的電器就是電燈,人類根本想象不出電有啥用,然而由于電的發明,世界出現了許多新的東西。那么今天的 AI 與早年的電其實是相差不多的,而且今天 AI 帶來的改變,會遠超過電的時代,遠超過大家的想象?!?/p>
本文作者:汪源,阿里研究院秘書長
本文根據浙江省科普聯合會周四夜學內容整理
來源: 科小二