9月27日,由數字開物協辦的“2024產學研融通創新活動——AI大模型應用場景”在北京召開,會上,中國信通院人工智能研究所基礎軟硬件部主任李論發表題為《大模型應用落地趨勢與路徑》的主題演講,她分享了大模型的演進,深入探討了大模型應用落地趨勢與路徑。
2024產學研融通創新活動——AI大模型應用場景
她表示,大模型已經成為新型智能化基礎設施,具備規??蓴U展性強、多任務適應性強、能力可塑性強等關鍵特征。大模型技術的范式變遷,特別是以Transformer為基礎的大模型的突破,為行業提供了通用賦能技術。算法演進是模型發展的關鍵,強化模型理解和多模態發展是演進的重點。她提到,盡管大模型技術占據主導地位,但專用小模型的并行發展和大模型的小型化同樣重要。
中國信通院人工智能研究所基礎軟硬件部主任李論演講
李論表示,大模型的落地需要模型本身智能化水平提升和高效的訓練推算系統支持。模型智能水平提升可以通過構建更大規模的模型系統來實現,同時,針對特定行業場景,通過微調和算法改造,提升模型與場景的契合度。
在她看來,模型演進的關鍵在于強化模型理解增強和多模態發展。開源模型和商業模型將并行發展,如何協同應用是未來關注點。同時,大模型的可控性,特別是代碼層級、智能層級、開發迭代的可控性、內容層面的可控性、智能水平的可控性,都需要重點關注。
李論認為,突破多模態瓶頸,增加視頻、音頻等多模態的通用模型是未來重點,行業模型的高價值、大規模應用落地場景是一個新的原點。開源在驅動產業智能水平基準線提升方面發揮著關鍵作用。
她表示,模型應用落地需要將其作為系統性問題來考慮,計算能力受大模型性能影響,兩者相互制約,HPC和AI的融合,特別是萬卡、千卡規模布局是難點也是機會。
李論認為,構建大模型應用底座需要軟硬件高效協同的新型基礎設施,實現基礎設施平臺化。底座構建需要解決Scale up和Scale out問題,以及硬件和軟件的協同適配問題。大規模擴展的網絡架構,面向大語言模型的定制化、國產化、規?;募軜嬻w系也在不斷出現。
最后,李論表示,未來一段時間模型水平發展仍然遵循規模定律,計算在一定情況下決定了大模型規模天花板。底層是軟硬高效協同的大系統,中間層以Transformer架構為核心驅動通用智能探索的大算法,上層是以模型為中心的大生態。中國信通院也在做一系列研究性工作,試圖解決大模型在工程化落地過程中與底座融合一體,實現工程化應用的方向。
以下是本場主題演講實錄:
中國信通院人工智能研究所基礎軟硬件部主任李論:各位專家,各位現場的業界同仁大家上午好,我是中國信息通信研究院人工智能研究所軟硬件與生態部李論,今天由我代表所里做分享報告。我的分享主要分成四部分,從大模型的范式變遷到模型的演進,底座的支撐和展望建議。
中國信通院人工智能研究所基礎軟硬件部主任李論演講
首先是范式變遷,其實我們知道從去年、前年開始整個大模型技術架構就在快速發展,以Transformer為基礎的大模型不斷在突破,也取得了業界的共識,大模型已經成為了這一時期的通用賦能技術,也成為了我們面向未來的一種新型智能化基礎設施。主要有三個關鍵特征,包括規模可擴展性強、多任務適應性強、能力可塑性強。到今天我們可以看到,今年模型整個的發展都是非常迅猛的,特別是從我們之前的語言類模型再到現在的多模態模型,再到具身智能整個發展,大模型也在封閉的機器世界完全到了和物理世界之間的交互發展的過程,使得我們整個大模型技術未來可以在更加復雜的,能夠在千行百業中深度應用的可能性。
第二個也想說的是這個模型怎么能夠落地,一方面是模型本身的智能化水平提升,還有一塊是如何訓和推大模型,其實從現在來看,整個大模型的系統是復雜的實驗工程。一方面是模型本身的智能水平,另外一方面它對整個計算量的提升是非常迅速的,從早期我們做大模型、小模型的訓練只需要單卡、多機、多卡就能完成,現在千卡、萬卡的智算集群也在不斷演進。
我們認為從現在來看,模型的尺寸增加仍然是精度最有效的提升方式,這里面有兩點,一個是我們去構建更大規模的模型系統來做模型的創新發展和應用落地。我們可以看到無論是這些基礎的大模型廠商還是一些典型的行業企業,國企、央企,都在試圖建模型的底座,試圖能夠把模型真正在行業里做微調,甚至構建行業的大模型,讓它真正能夠落地。
提升智能水平其中一個方式就是構建更大規模的系統,來承載更大規模參數的模型訓練。當然,我們可以看到不是所有有資本或者有實力的單位都可以搞這么大規模的系統的,在現有系統下如何提升模型的智能水平,能夠讓模型和它的典型場景深入契合,這也是我們的一個關鍵,這就涉及到了關鍵的點,比如說在行業落地的過程中訓練的數據、微調的數據至關重要,它是在有效的資源下提升模型和行業結合的關鍵。第二個去做一系列的算法層面的改造。
第二,算法演進。我們認為強化模型理解增強和多模態的發展是模型演進的關鍵,這里面也在討論一個范疇,就是目前人工智能的發展,大模型技術確實是在主導的位置。大模型不是一個模型形態,其實是研發創新和訓練的范式,但同時專用的小模型也在并行發展,特別是還有另外一個,如何把大模型小型化,真正能在行業中釋放技術的能力和范疇也是我們關鍵的重點。
從目前來看,模型整個關鍵任務的能力是在不斷提升的,特別是在典型的通用智能的任務里,同時開源模型也在不斷追趕這個差距。我們可以看到現在很多行業在落地的過程中都會兩條腿走路,一方面會考慮一些開源的模型試一試、用一用、跑一跑,另外也會和主要商業化的廠商做溝通,去看一看他們商業模型或者用模型工程化平臺做落地,所以有一個議題就是開閉源模型怎么結合,以及大模型、小模型怎么協同,這也是大家現在關注的重點。
其中一個核心就是模型作為基礎底座有一個關鍵點,是將來的可控問題,特別是針對一些大的行業領域,大模型作為基礎設施之后它的代碼層級、智能層級如何可控,開發迭代的可控、內容層面的可控、智能水平的可控,都是我們需要關注的點。
同時我們認為突破模型模態的瓶頸,增加視頻、音頻多模態的通用模型是后面的重點,可以看到這個判定在去年、前年我們已經做過了,多模態的基模研究到今天我們仍然認為還沒有到收斂的階段,一個是多模態對齊問題,多模態視頻生成的問題,包括今年以來不斷出來的ChatGPT4o,谷歌相關的模型大家都在解決這樣的問題?,F在有不同的陣營,現在發展還是比較快的,從今天來看我們知道基礎模型的發展已經收斂了,但行業模型的落地,或者行業模型高價值大規模應用落地場景是一個新的原點。
此外也想表達一個事情,就是開源的作用,今天我們可以看到確實在行業里實際應用的很多大模型還是以閉源模型服務方式在提供,但是我們認為開源是整個驅動產業智能水平基準線提升的一個關鍵,能夠整體性抬高大模型技術在各行業應用的可能性的基礎。特別是像這些開源模型和與做軟硬件的適配結合,對上服務模型平臺的集成,這樣生態的能力也是我們在大模型應用落地過程中選型需要關注的要點。
第三,底座支撐。到今天我們認為模型的原始創新其實是跟底下的大模型訓推系統高度結合或者深度耦合的,我們去看模型應用落地的時候要把它當作系統性的問題來考慮,而且我們認為真正能落地,計算的能力是受到大模型性能的影響的,兩者之間有相互制約關系,HPC和AI的融合,往萬卡、千卡方面布局這一塊是難點、卡點,也是機會。
所以在這個層面上我們認為有三個非常關鍵的要點,軟硬高效協同的新型基礎設施,整個人工智能產業鏈的形態在發生變化,早期的時候我們產業的水平化是非常顯著的,從芯片、框架、平臺、模型到應用,每個產業鏈都有自己關鍵的產品。到今天來看,因為現在整個主導路線變成了大模型、大數據、大算力,以大模型為主導的載體或者智能的核心,底層的產業鏈體系架構也在往基礎設施的方向發展,所以我們會發現芯片從單點變成了大規模的集群,里面涉及到網絡的問題,涉及到萬卡規模性的問題,上面的框架從我們早期的集成各類小模型的模型庫、工具鏈,解決工程化的問題,到現在我們會發現像DeepSpeed分布式加速框架成為了關鍵,再到平臺層,平臺層也是一樣的,我們相當于集成了若干大模型做相關的工作,它的集約性、平臺屬性會更凸顯。在早期一公里碎片化的問題,我們相信在今天模型落地的過程中能有所緩解,實現真正設施的平臺化。
這里面有幾個簡單的點可以簡要講一講,一個是怎么構建這個底座,這里面有個Scale up和Scale out的問題,一方面我們會發現現在硬件和軟件的協同適配的問題,是我們關注的重點。第二個是真正把規模擴展到百卡、千卡、萬卡的時候,追求線性集群的擴展能力也是非常難的,仍然是現在工程界和學術界共同在解決的問題。當然還有大規模擴展的網絡架構,面向大語言模型的定制化、國產化、規?;募軜嬻w系在不斷出現。
最后我們的挑戰和建議,如何準確度量智算集群系統,來實現大模型在各行業落地過程中的底座問題,其實很多行業真正用的時候是用的大模型壓縮之后的小模型能力,終端邊緣側設備到底是什么形態來承載這種模型?我的實際應用場景,不同的實際場景里,軟硬件的結構怎么融合模型和底下的硬件體系,實現多元化的能力也是我們關注的一個重點,所以關于底座的構建,軟硬件的適配以及差異化的運營也是我們的觀點。
第四,展望建議。我們認為未來一段時間模型水平發展仍然是遵循規模定律的,計算在一定情況下決定了大模型規模天花板,在底層我們認為是軟硬高效協同的大系統,中間這一層還是以Transformer架構為核心驅動通用智能探索的大算法,上面的模型平臺是以模型為中心的大生態。
當然中國信通院也在做一系列研究性的工作,我們也試圖去解決大模型真正在工程化落地過程中我們需要跟底座融合一體,真正實現工程化應用的方向。我們就構建了一套體系叫AISHPERF,實現兼容適配和面向不同類型場景系統化能力的驗證和測試。我們也構建了一個人工智能的推進組,匯聚了產業鏈上下游70多家企業和研究機構,也歡迎各單位如果有意可以加入進來,共同推動我們在大模型時代人工智能落地過程中工程化的,大系統的,協同的問題。
中國信通院建設了人工智能軟硬件協同和適配驗證中心,這個中心就落地在了亦莊信創園,這個中心也承載了國家層面上現在在推動的人工智能軟硬件協同相關的技術攻關、標準制定、生態培育、測試驗證等一系列的相關工作,也歡迎大家的關注。
最后,我相信在這個時代大模型的技術紅利確實已經可以在各行業中落地,這里面的核心是怎么解決最后一公里和工程化相關的工作的,能夠把這個能力充分釋放出來,也希望和業界共同推動大模型的應用發展,謝謝。