東數西算正在成為各行業的普遍機遇,對于運營商來說也是如此。
東數西算帶來了全新的算力網絡建設需求,以及各行業普遍的網絡升級需求。在這一大背景下,運營商還需要一系列細分的價值節點來推動業務進步,打開市場空間。換言之,東數西算的路有了,運營商接下來更需要關注路上跑哪些車。
在東數西算的整體架構中,AI預訓練大模型的價值值得關注。近年來,大模型可謂AI領域最受關注的方向。高魯棒性的模型效果,卓越的數據集表現,以及跨模態等領域的不可替代性,讓大模型成為產業界與學界共同關注的對象。一時間,“煉大模型”成為了AI產業的共同需求,為此也衍生出配套產業的全新機遇。
大模型的算力要求非常嚴苛,并且需要一系列軟硬件基礎設施的支撐,比如基于昇騰AI的人工智能計算中心。不過,單個的計算中心之間算力供給存在差異,因此在東數西算的背景下,將東部算力需求有序引導到西部,優化數據中心建設布局,促進東西部協同聯動,能更好地促進大模型產業發展。
對于運營商來說大模型帶來了一系列全新的AI市場空間。運營商幫助大模型進行跨地域訓練,完成算力資源適配,構成了新的服務機會;而運營商本身運用大模型,也可以提升服務能力與產業效率。
01
運營商的新賽道:
大模型訓練帶來的市場想象
OpenAI在2018年發布了一份著名的調查報告,從2012年開始,全球AI算力在六年間增長了30萬倍,并且還在持續增長。而當大模型時代正式到來,全球AI算力需求進一步加大。AI算力成為了限制產業智能化發展的主要挑戰。
2018年,谷歌發布了NLP領域的預訓練模型Bert,其優越的能力快速得到業界認可。OpenAI打造的GPT-3在多項任務中實現了跨越級的表現,推動全球大模型迎來了爆發式的發展,模型參數呈現了指數級的增長。“大數據+大模型”成為了AI產業最受重視的發展之路。
但在實踐過程里,我們卻可以發現大模型在訓練與部署中存在著諸多挑戰。比如部署場景中存在的模型性能不足問題;不同場景下大模型的泛化能力不強;預訓練大模型參數多、計算量大,訓練成本高企等等。其中,如何低成本、高效率地完成大模型訓練,成為首先需要解決的問題。在這種背景下,將大模型在東數西算背景體系下進行模型訓練,正在成為越來越多企業與學術機構的選擇。
比如中國科學院自動化研究所在 2021 世界人工智能大會上發布了跨模態通用人工智能平臺——“紫東.太初”。其依托面向超大規模的高效分布式訓練框架,構建了具有性能優良的中文預訓練模型、語音預訓練模型和視覺預訓練模型,并開拓性地通過跨模態語義關聯實現了“視覺-文本-語音”三模態統一表示,構建了三模態預訓練大模型,賦予跨模態通用人工智能平臺多種核心能力。從應用層面上看,“紫東.太初”兼具跨模態理解和生成能力,在“以圖生音”和“以音生圖”等方向上具有廣泛的應用空間,可以實現AI為視頻配音、AI語音播報、AI海報創作等應用場景。
2022年,千博信息基于昇騰AI和昇思MindSpore AI框架,利用“紫東.太初”三模態大模型,打造了手語教考一體機,開創性地實現手語動作與示意圖片和文字的聯動。目前,該一體機已在湖南數十個學校陸續上線,一定程度上緩解了手語師資短缺問題,帶來了重要的社會價值。
而在“紫東.太初”大模型的訓練過程中,就非常能夠展現出東數西算背景下,大模型進行“東數西訓”的典型邏輯。這一模型由中科院自動化所相關團隊主導,基于昇騰AI基礎軟硬件平臺,在武漢人工智能計算中心完成訓練。可以說提前替更多大模型嘗試了“東部數據-中西部算力訓練-東部應用”的產學研結合方式。
以此為案例,我們可以看到運營商的AI新市場正在快速打開。而能夠讓運營商服務大模型的新市場打開,產業底座的完善性至關重要。
02
昇騰底座:
為運營商AI賽道保駕護航
大模型走上“東數西訓”之路,有幾個必要的產業條件:算法、數據、算力、訓練所需的軟硬件基礎設施、算力網絡。
從目前階段來看,大模型的訓練算法已經日益完善,國際與國內的大模型訓練基礎門檻不斷降低。接下來是數據,東部地區的企業、高校、科研機構積累了豐富的數據,可以有效投入大模型的訓練當中。這也是中國在大模型之路上雖然后起,卻能夠奮起直追的原因。
接下來是算力,隨著各地人工智能計算中心拔地而起,以集群化、集中化的AI算力來完成大模型訓練,已經成為可能。昇騰AI提供的AI算力體系,既可以作為人工智能計算中心的建設基礎,也可以通過多種方式賦能產學研各界,帶來充沛、完整的AI算力供給。
而在軟硬件配套設施層面,昇騰AI基礎軟硬件平臺,包括Atlas系列硬件和伙伴硬件、異構計算架構CANN、全場景AI框架昇思MindSpore、昇騰應用使能MindX、全流程開發工具鏈MindStudio 和一站式AI開發平臺ModelArts等。為了能夠滿足越來越多企業與學術機構的大模型訓練需求,昇騰AI已經打造了大模型的全流程使能體系。該體系包含從大模型規劃、大模型開發到大模型產業化的全流程,可以實現端到端加速大模型產業落地。
我們可以看到,在大模型的需求與基礎技術崛起后,以昇騰AI為代表的規模化、產業化AI基座已經走向完善。大模型不但是能訓,更加走上了簡單、高效、低門檻可訓的新周期。
大模型的最后一個關鍵需求就是網絡與網絡配套服務,而這可以成為運營商的重大機遇。可以說,昇騰為運營商的AI賽道起到了保駕護航的價值。
03
以AI拓展未來:
運營商創新正當時
AI技術在運營商業務版圖中的重要性正在不斷上升。早在2020年,Omdia的ICT-Enterprise Insights就公布了一項調查數據,有近80%的全新運營商認為使用AI技術是一項“重要”或“非常重要”的IT項目,其中近60%的運營商計劃增加對AI工具的投資。
我們可以看到,如今在運營商使用AI、應用AI的場景與價值已經非常廣泛。比如面對5G網絡復雜的運維管理需求,主流運營商都已經使用AI技術來實現網絡的智能分析、實時預測和自動化運維。在智能客服與智能外呼平臺中,NLP與多輪對話技術已經成為提升運營商服務觸達效率的關鍵。AI技術也是運營商專網服務等新模式的重要助力,比如在冬奧期間,中國聯通就通過AI、云計算、區塊鏈技術與5G結合,護航智慧冬奧。與此同時,運營商在AI技術上的投入與建設水準也在不斷加強。
在這個大背景下,用好AI技術,以及服務客戶用好AI技術都成為運營商的關鍵需求。而昇騰底座恰好可以為運營商帶來廣泛且關鍵的支撐作用。比如說,浙江移動就依托九天平臺+昇騰底座,構建了全棧自主創新的行業AI賦能試驗平臺,提供面向行業的人工智能基礎設施,可實現數據賦能、算法賦能、應用賦能。該平臺預置了900+算法和800+預訓練模型,可快速定制算法模型,以滿足城市多樣化的場景應用需求。通過開放標準化接口,模塊化方案組合,為城市管理提供多場景的AI服務,全力推進算力成為像水電一樣“一點接入,即用即取”的公共服務。
面向未來,我們可以看到更行業、產學研各界都在涌現出大模型的訓練與部署需求。進一步來看,大模型屬于產業級AI能力與應用的一部分。除了一般意義上的預訓練大模型,還有更多重度AI模型、AI能力需要踐行跨地域的訓練。
與此同時,運營商本身也是大模型與重型AI能力的需求主體。5月16日,浙江移動在電信日發布的 “杭小憶”就是基于“紫東.太初”,疊加杭州特色景點——南宋御街的場景,進行高效的本地化增量訓練打造而成的文旅數智人。
面向未來,會有越來越多的大模型踏上東數西算之路。不久之前,“中國算力網-智算網絡”正式上線,這是中國算力網絡建設邁出的重要一步。接下來,會有包括大模型在內的大量AI任務在算力網絡中完成訓練與部署。而運營商可以在算力網絡的基礎上,共同參與建設算力網絡統一大市場,實現全程全網的社會級算力服務,這對于運營商來說是一個巨大機遇。運營商既可以成為算力網絡建設的主力軍,也將從AI帶來的網絡增量中主要獲益。
這些趨勢與變化,正在構成運營商的全新賽道。大模型訓練帶來網絡需求增加,配套網絡服務更加復雜。這些特點都可以為運營商帶來極高的價值增量,并且助力打開東數西算大背景下的連續性市場空間。
大模型的產業紀元面前,運營商手中掌握著大模型產業化的最后一塊拼圖。運營商關注、發力這一市場,也有助于大模型走向規模化應用與產業級繁榮。
未來,大模型訓練者、昇騰AI、運營商與產業需求的“四方聯動”,將構成一個高效率、低門檻的產業范式,推動AI黃金時代的到來。