“你好,我是你的智能助手,請問有什么可以幫您?”

也許你早已習慣了和智能手機、客服機器人“對話”的場景;也許你用過ChatGPT、文心一言這樣的AI生成文字、翻譯、寫代碼。它們背后的核心技術,叫做大語言模型。這是當今人工智能最前沿的代表之一——能讀、能寫、能答題,甚至能“講故事”,像一個永不疲倦的智慧圖書館。

圖片來源:百度文心一言首頁

而你或許不知道,在它們順暢回應你的那一刻,藏著成千上萬名中國科研工作者夜以繼日的努力。他們在沒有頂級算力、沒有完整生態的條件下,從零構建出屬于中國自己的“AI語言大腦”,用技術和汗水書寫下這個時代的科技答卷。

1、超級“語言大腦”是如何煉成的?

所謂“大語言模型”,指的是一種通過學習大量文本數據,從而具備語言理解與生成能力的人工智能系統。它不是真正“懂”語言,而是通過龐大的參數和復雜的訓練機制,讓機器學會了“預測下一個詞”。這個過程,需要成百上千億級的模型參數、千萬本書的總信息量、數周甚至數月的訓練時間。

比如ChatGPT,背后是OpenAI花費數億美元、使用幾千張高端GPU顯卡和超大語料訓練出的成果。而在中國,自主研發出擁有數百億甚至千億參數的語言模型,是科研者面對的一場“硬仗”。

2、國產大模型,破局之路走得很難

研發大語言模型,最難的不是“寫代碼”,而是“通盤突破”:

01語料難

中文的語言結構更復雜、歧義性更強,公開高質量中文語料少。科研者不得不從網頁、書籍、論文、論壇中手動清洗出語料,還要過濾“低質文本”和“敏感內容”。一個模型的訓練語料,往往需要上百人投入數月篩選處理。

02算力緊

大模型訓練是資源密集型工程。以千億參數模型為例,動輒需要數千張GPU服務器支持,而在芯片領域,我國受制于供應鏈“卡脖子”。于是科研者用“模型壓縮”“并行調度”等方式做減法,用最少的資源跑出最好的效果。

03對標高

ChatGPT帶來的震撼讓世界意識到:誰掌握了大模型,誰就能在人工智能時代的中占據重要地位。中國必須有自己的AI底座,自己的語言理解系統。為此,“悟道”“ChatGLM”“文心一言”“天書”“百川”“DeepSeek”等國產大模型接連問世。

根據國家互聯網信息辦公室最新披露的數據顯示,截至2025年4月,已成功通過備案的人工智能大模型數量達到了346家——從通用模型,到金融、醫療、教育等行業專用模型,這背后,是無數科研團隊晝夜鏖戰的成果。

3、那些讓人動容的科研者故事

2023年,天數智芯的天垓100國產GPU加速卡迎來了一場硬仗——為北京智源研究院訓練70億參數的Aquila語言模型提供算力支持。面對國產GPU與國際頂尖產品的性能差距,天數智芯產品線總裁鄒翾帶領團隊展開了一場技術攻堅戰。他們日夜兼程,重構IXCCL通信庫,優化混合精度訓練方案,硬是將多卡通信效率提升至98%,最終實現了連續19天的穩定訓練。當Aquila語言模型如期完成訓練并達到預期效果時,這支團隊用行動證明:在算力自主化的道路上,中國人的創新精神永遠不會被硬件條件所限制。

圖源:pexels

在高校、研究所、企業、實驗室,從“算法調優”到“數據治理”,從“推理優化”到“模型壓縮”,每一個細節都凝聚著無數人沉默卻堅定的努力。他們或許不在鏡頭前,不在熱門話題里,卻正是AI革命的無名英雄。

4、把AI寫進中國語言和文化

“我們希望讓AI用中文思考。”這是很多國產大模型團隊的共同目標。

不僅僅是翻譯得通順,更要理解中國語言的語境,理解我們的典故、成語、對聯、詩詞,甚至是“一個眼神”的情感含義。科研者正在將這些“文化基因”注入AI中。

有人用模型進行古文翻譯,有人訓練AI生成中醫問診語言,還有人嘗試用AI保護瀕危方言。AI不是替代人類,而是服務社會、傳承文明的新工具。大語言模型正逐漸從科研實驗室走進醫療、教育、司法、工業、文旅等多個領域,為人類解決實際問題,也為中國講好自己的故事提供了新的載體。

5、寫在“全國科技工作者

2025年5月30日,是第九個“全國科技工作者日”。我們將目光投向那些或許無名卻做著意義非凡的事情的科技工作者,他們在國產AI道路上,仰望星空,腳踏實地。

在大模型這場沒有硝煙的科技競賽中,他們不僅是工程師,更是文化守望者,是時代的記錄者。他們用代碼構筑語言的秩序,用數據打造理解的基石,用算法塑造思維的邏輯。

他們是這個時代最可敬的人之一。

致敬中國每一位科技工作者,向你們說一聲:節日快樂,未來可期。

供稿單位:重慶理工大學計算機科學與工程學院

作者:重慶理工大學 張佳雯

審核專家:倪偉

聲明:除原創內容及特別說明之外,部分圖片來源網絡,非商業用途,僅作為科普傳播素材,版權歸原作者所有,若有侵權,請聯系刪除。

來源: 重慶市科學技術協會

內容資源由項目單位提供