7月以來,數字開物已收集超過百份"AI大模型應用場景"案例報名申請及產業問題,聚焦這些大模型應用落地的真實產業問題,8月6日順利召開了"AI大模型應用場景"產學研融通創新活動——產業問題專家研討會。
與會期間,中國科協企業創新服務中心、中關村產業技術聯盟聯合會與中國通信工業協會數據中心委員會相關領導,中國信息通信研究院人工智能所、北京智源人工智能研究院、清華大學、北京服裝學院繼續教育學院等科研機構及院校專家,以及中國三峽集團武漢科創園、電信安全、西云算力、火山引擎、科大訊飛、靈汐科技等各領域領軍企業代表展開了深入探討,20多位各專家及企業代表從算力、數據、算法、產業生態和人才等多個維度,深入剖析當前AI大模型應用發展面臨的機遇與挑戰。
總的來看,我國大模型發展面臨著多方面的挑戰:
算力層面
國內算力缺口問題依然存在,尤其智能算力。隨著技術的不斷迭代,算力需求持續增加,導致算力缺口不斷擴大。與此同時,通信、能源等相關領域的瓶頸也進一步加劇了這一問題。
國內算力缺口問題
從技術方面來看,高端算力的自主可控是一個關鍵問題。盡管中國在總體算力規模上已位居世界前列,但在高端芯片等核心硬件方面仍存在較大差距,這直接影響了大模型的訓練效率和規模。此外,國內大模型在某些關鍵技術上依賴國外,缺乏原創性算法模型,導致產品技術水平出現同質化競爭。
從成本方面來看,盈利壓力對大模型發展構成了挑戰。企業出于盈利考慮,難以將所有算力投入大模型研發。如果短期內無法從大模型業務中獲得盈利,企業可能會放棄這條產業線,轉而發展其他業務。即使企業意識到算力缺口的存在,但為了保證盈利,他們也不可能無限投入到大模型研發中。
數據層面
當前我國在行業數據積累方面還存在明顯不足,現有的數據質量普遍不高,結構化的高質量數據相對匱乏,特別是專業領域高質量數據不足。
高質量數據相對匱乏
例如,國產模型生成視頻經常出現外國人臉的現象,分析其背后的原因發現,一是國內的視頻資源不夠豐富,所以必須用國外的影視資料來進行訓練,二是即使能夠獲取國內視頻數據,企業也會擔心肖像安全隱私問題,不敢使用。
多模態異構數據的整理和處理是面臨挑戰,尤其是海量歷史數據的人工標注工作非常耗時。
數據安全與隱私保護問題,數據脫敏與安全管理能力不足,個人隱私數據買賣等問題依然存在。
數據確權和流通問題,缺乏統一的數據安全分類標準,不同行業數據交易存在認可度和安全性問題,數據分散在不同機構手中,由于缺乏有效的流動和共享機制,企業數據共享意愿低。
應用層面
模型在復雜業務場景中的應用存在挑戰。當前大模型在處理多步驟、多變量的復雜業務流程時,仍存在理解和執行上的局限性。
行業垂直應用落地難題不斷。不同行業有其特殊的知識體系和業務邏輯,如何將通用大模型有效地適配到特定行業,實現從技術到價值的轉化,仍然面臨諸多挑戰。
例如,在特定領域如醫藥、新能源等行業,構建專業知識圖譜和智能問答系統面臨技術挑戰,需要深度融合行業專業知識與AI技術。
再比如,大語言模型問答形式在一些傳統制造業落地應用中難以得到生產單位認可。一些生產單位決策者會關心成本的問題、人力的問題,僅僅是問答應用意愿度不高,例如,有傳統制造業上產單位認為一線的巡檢人員,能把業務要求流程背得滾瓜爛熟,為什么還要用這個問答系統。
大模型應用
產業生態層面
模型廠商方面,缺應用缺場景。算力、模型做差不多了,應用場景目前看不到爆發點,展開來說,廠商在探索場景時面臨一系列問題,如算力能否支持、業務本身是否能做大模型、技術是否可達以及、數據歸屬問題、安全性等因素都具有不確定性。
尤其是B端大模型應用推廣效果不如預期,企業級客戶對模型精準度要求最高,如何將模型適配到產業發展上?
企業客戶方面,一些B端客戶在引入大模型時候,對AI大模型能做什么,不能做什么,能做到什么階段沒有清楚的認知,企業在實際部署模型時不能清晰提出需求,是否需要進行教育培訓?
此外,整個產業還面臨人才供需不平衡的問題。一是人才短缺,高端人才嚴重不足。例如,技術方懂技術不懂業務,客戶懂業務不懂技術,懂技術又懂業務交叉型的人才少,再比如在算力方面萬卡集群調優高端人才短缺。二是行業人才有動態需求,企業很難能在一個時段找到合適的人。
關于人才短缺的問題是需要教育口來培養人才還是產業端自己培養人才來完成供給也面臨著矛盾。
針對研討會所探討的一系列算力瓶頸、數據困境、模型開發落地挑戰、產業生態創新不足等問題和挑戰,誠摯邀請各企業參與“AI大模型應用場景解決方案”征集活動,歡迎能提供創新解決方案的企業踴躍報名。
“AI大模型應用場景解決方案”征集活動
-掃碼申報-
“AI大模型應用場景”產學研融通創新活動流程
解決方案征集:2024年8月8日-8月28日
解決方案專家論證會:2024年8月30日
供需對接洽談會:2024年9月3日
發布/參會時間:2024年9月26日