大模型時代,編譯器再一次站在了聚光燈下。 7 月 5 日,HyperAI 超神經在北京中關村舉辦了第 7 期 Meet AI Compiler 技術沙龍,聚焦分布式通信、國產 GPU 編譯棧、新編程語言設計與開源生態建設,邀請了來自 AMD 、沐曦集成電路、字節跳動和北京大學的資深 AI 編譯器專家,圍繞各自「真實在做、也真的做出成績」的技術路徑,系統呈現了各自項目中的關鍵機制與實現細節。
關注微信公眾號「HyperAI 超神經」,后臺回復關鍵字「0705 AI 編譯器」,即可獲取確認授權的講師演講 PPT 。
在圓桌環節中,由上海創智學院助理教授、 Apache TVM PMC 馮思遠擔任主持人,聚焦「跨硬件的統一編譯生態」這一主題,與 4 位講師深入探討了不同硬件平臺的協同與挑戰。
本次活動不僅僅是臺上講師的「知識輸出」,來自社區小伙伴的互動同樣精彩紛呈。無論是對技術細節的深入追問,方案選型的延展討論,還是茶歇時的自由交流,大家都毫無保留地分享自己的經驗與見解,圍繞自己遇到的實際問題展開了熱烈而真誠的對話。這種「雙向奔赴」的氛圍,才能讓我們的技術社區更有溫度!為本次技術沙龍畫上了完美句號。
活動內容回顧
以下為分享內容簡介以及分享實錄文章。
分享主題:助力開源社區,剖析 AMD Triton 編譯器
內容簡介:Triton 是 OpenAI 提出的一種專為簡化高性能 GPU Kernel 開發而設計的編程語言,在主流的 LLM 推理訓練框架中得到了廣泛應用。用戶可以通過開發 Python Triton 代碼來實現 GPU Kernel,無需關心底層的 GPU 架構細節,大大降低了 GPU 代碼的開發難度。
AMD 在相關的 GPU 平臺上實現了 Triton 編譯器,并且貢獻給了 Triton 開源社區。為了優化 GPU 代碼性能,需要了解 Triton 編譯器及其在 Kernel 性能優化中的作用。本次分享將詳細探討 AMD Triton 編譯器,介紹 編譯器如何提升 Triton 在 AMD GPU 平臺上的性能。
觀看本場分享,你將了解:
1. AMD GPU 架構的介紹
2. AMD GPU 在 Triton 開源社區上的最新工作
分享主題:沐曦 GPU 上的 TVM 應用實踐
內容簡介:這次討論主要圍繞如何在沐曦 GPU 上應用 TVM 。針對沐曦 GPU,圍繞 TVM 進行高性能算子生成,使能基于 TVM 的主流 AI 框架。
觀看本場分享,你將了解:
1. 國產 GPGPU 上適配 TVM 可能會碰到的問題
2. TVM 在國產 GPGPU 上的收益如何,以及哪些方面需要繼續突破
3. 關于 TVM 等 AI 編譯器在國產 GPGPU 上的支持現狀,并討論如何拓展相關生態圈
分享主題:Triton-distributed: 原生 Python 編程實現高性能通信
內容簡介:單芯片規模化漸至瓶頸,單加速器難支撐大語言模型訓練推理,分布式系統成剛需。分布式系統中計算、內存訪問、通信并發,但現有框架多獨立優化,難以協同釋放集群性能。
本報告提出 Triton-distributed(Triton 編譯器擴展),首倡分布式 AI 工作負載原生重疊優化,覆蓋多框架優化。通過集成 OpenSHMEM 通信原語、借助編譯器實現三項活動聯合優化、展示重疊技術應用及單 / 多節點編程方法,其生成代碼在集群環境中充分利用異構資源,性能超越手工優化代碼,且開發成本顯著低于 CUDA/C++。
觀看本場分享,你將了解:
1. Triton-distributed 最新技術
2. 從 Python 編程通信的挑戰
3. 分布式編譯未來方向
分享主題:TileLang:算子開發不再「燒腦」,性能依然在線
內容簡介:本次分享我們帶來新的算子編程語言——TileLang 。它通過顯式的 tile 級原語與自動推理機制,賦能開發者高效實現硬件感知的神經算子,兼顧控制力與開發效率。
觀看本場分享,你將了解:
1. 掌握一種更簡單、更高效的高性能算子開發語言
2. 了解 TileLang 的核心設計理念與技術優勢
2025 Meet AI Compiler · 敬請期待2023-2025 年,我們在北京、上海、深圳成功舉辦了 7 場線下 Meetup,聚集了上千位資深從業者及愛好者,逐步建立了豐富的社區生態。 2025 年,我們將繼續開拓 AI Compiler 城市地圖,誠摯邀請各位企業及社區伙伴們以各種形式參與共創,無論是推薦講師還是提供場地、茶歇,我們都非常歡迎~
讓我們攜手創造國內最活躍的 AI 編譯器社區!最后分享一張現場的大合影 ??
主辦方及合作伙伴
HyperAI 超神經(hyper.ai)作為國際領先的人工智能及高性能計算社區,旨在通過提供行業資訊報道、數據集加速下載、在線教程演示、熱門模型性能評測、前沿論文推薦、高價值成果解讀、頂會日歷集成等一系列服務,助力全球數據科學及??智能?業的開發者及愛好者學習、理解、實踐,與社區?起構建??智能的未來。
OpenBayes 貝式計算是國內領先的高性能計算服務提供商,通過為新一代異構芯片嫁接經典軟件生態及機器學習模型,進而為工業企業及高校科研提供更加快速、易用的數據科學計算產品,其產品已被數十家大型工業場景或頭部科研院所所采用。
MLC.AI 社區成立于 2022 年 6 月,并由 Apache TVM 主要發明者、機器學習領域著名的青年學者陳天奇,帶領團隊上線了 MLC 線上課程,系統介紹了機器學習編譯的關鍵元素以及核心概念。
2022 年 11 月,在 MLC.AI 社區志愿者的共同努力下,首個完整的 TVM 中文文檔上線,并成功托管至 HyperAI 超神經官網,進一步為對機器學習編譯感興趣的國內開發者,提供了接觸并學習一門新技術的基礎設置——文檔。
車庫咖啡成立于 2011 年 4 月,是中國最早關注早期互聯網創業,面向早期創業者圍繞 “大眾創業” 打造低成本、便利化、全要素、開放式創新創業服務平臺。
作為北京中關村創業大街首家眾創空間,車庫咖啡以咖啡廳為交互載體,為創業團隊提供共享、共促、共融、共生交互式辦公空間與創孵配套服務。車庫咖啡是全球第一家創業主題咖啡廳,是中國最具影響力的國家級眾創空間和國際化創新創業平臺。
活動支持
獲取 PPT:關注微信公眾號「HyperAI 超神經」,后臺回復關鍵字「0705 AI 編譯器」,即可獲取確認授權的講師演講 PPT 。
來源: HyperAI超神經