2023年過去幾個月里,高通一直在鼓吹手機大模型。
就好像是要用行動證明,大模型這件事兒,不能只肥了英偉達,高通也要分杯羹。
高通著急是有原因的,畢竟智能手機市場已經觸頂,XR市場還未起量,高通剛剛公布的三季度財報中“智能手機芯片銷量下降25%,QCT部門銷售額同比下降24%”格外顯眼。
這與英偉達H10043萬張的供給缺口形成了鮮明的對比。
于是,我們看到,今年2月,高通官方YouTube發布了一則40秒的“短視頻”,在這個視頻中,高通為一部有明顯驍龍標識的安卓手機裝上了StableDiffusion,并用14.42秒生成了一張AI圖片。
StableDiffusion是當下最火的AI繪圖軟件,也是一個擁有10億參數的大模型。
不過,10億級參數的StableDiffusion顯然無法與如今千億級參數的GPT-3.5、萬億級參數的GPT-4相提并論。
高通的目標自然也不止于此,高通隨后不僅又在手機上演示了15億參數的ControlNet,還多次對外布道,“年內將在手機上支持100億級大模型。”
就在英偉達顯卡賣瘋了的這一年,看似與大模型中間隔著無數張H100的手機,開始要上大模型了。
然而,手機上大模型這件事兒,可能遠沒有你想得那么高級,但遠比你想得要重要。
01
谷歌將“小模型”裝進手機里
2017年7月,谷歌母公司Alphabet宣布,接任谷歌CEO一職兩年的SundarPichai正式進入董事會。
對于Pichai來說,這無疑是對他過去兩年工作最大的肯定。
而就在兩個月前的谷歌I/O2017大會上,Pichai剛剛宣布,接下來,谷歌公司戰略將從“Mobilefirst”轉向“AIfirst”,AI開始上升為谷歌的公司戰略,這時距離谷歌收購DeepMind剛剛過去三年。
這一年發生的另一件奠定了谷歌在AI領域江湖地位的事兒是,谷歌大腦團隊在發表的《AttentionIsAllYouNeed》中創造性地提出了Transformer架構。
這一架構不僅成為后來人工智能和自然語言技術發展的基石,也直接促使OpenAI團隊開創了如今的ChatGPT盛世。
不過,這些不是我們今天要討論的重點,我們今天要討論的是谷歌在這一年另一項,對于手機這樣的終端設備影響深遠的AI突破——聯邦學習(FederatedLearning)。
機器學習是人工智能的主流研究方法,然而,以往將這樣的人工智能能力應用到終端設備上時,通常需要經歷一個“終端數據收集-發送數據到云端-云端模型訓練-終端執行決策”這樣一條長鏈路。
究其原因,是因為終端設備算力和存儲資源都極為有限,要在手機這樣的終端上進行AI模型訓練不現實。
不過,谷歌并不這么想,他們通過一個頗為討巧的方法——端云協同,嘗試在終端上研究人工智能技術。
2017年4月6日,谷歌在官方博客中更新了一篇文章——《FederatedLearning:CollaborativeMachineLearningwithoutCentralizedTrainingData》,在這篇文章中,谷歌AI科學家指出:
“在手機從云端下載AI模型后,在手機上,通過手機上的數據訓練并改進模型,改進部分被單獨總結并發送回云端,用于改進云端‘大模型’。
這其中,所有訓練數據都保留在手機本地,不再單獨更新并存儲到云端。”
聯邦學習的模式,優點在于解決了人工智能研究過程中的數據安全問題,但是并沒有從根本上解決本地設備算力、存儲資源受限的問題。
在聯邦學習框架之下,最初下載到本地設備的AI模型和云端AI模型是一個同樣大小的模型,好在谷歌當時找到了一個恰好符合這一方法的應用場景——手機輸入法。
谷歌當時是基于自家的Gboard輸入法做了一個端側系統中的推薦引擎,當你用手機的Gboard輸入一個字母或單詞時,推薦引擎會根據你的歷史使用數據推薦相應的關聯內容給你。
這樣的功能在諸如百度輸入法、搜狗輸入法等各類輸入法中已經得到了廣泛使用,也在潛移默化中改變著我們的手機使用習慣。
例如現在越來越多人在手機上已經習慣了使用九宮格輸入法,背后少不了這種推薦引擎帶來的便利和魔力。
不過,手機輸入法涉及的單詞量有限,通常一門語言的常用單詞量在1萬個左右,有國內研究團隊預測,谷歌當時推出的這一輸入法推薦引擎模型體積可能只有約1.4MB大小。
因而,嚴格意義上來說,谷歌六年前提出的聯邦學習,實際上只是將占用資源量有限的“AI小模型”裝進了手機里。
谷歌的聯邦學習,只是驗證了端側AI的可行性,邁出了端側AI的“一小步”。
02
超越“小模型”
就在谷歌提出聯邦學習不久,由于其在隱私性和安全性上的突出表現,使得它在金融領域得到了廣泛應用。
與此同時,端側AI的發展,也并沒有停在“AI小模型”上。
上海交大吳帆教授團隊是從2019年開始研究端側人工智能技術,吳帆教授團隊當時是與阿里的團隊基于手機淘寶的應用需求,做的偏應用性的技術研究。
每當你在手機上打開京東或淘寶等線上購物平臺時,第一屏上總會出現你最近搜索過或想過要買的商品,這背后其實就是一套類似前文中提到的輸入法推薦引擎一樣的推薦引擎。
不過,電商平臺面向的是10億級用戶和數十億商品信息,因而推薦引擎所需的計算資源和存儲資源,都是輸入法這樣的手機應用無法比擬的。
僅僅以模型大小來看,要想嵌入20億個商品信息,模型規模就已經達到了130GB,如果仍然照搬谷歌提出的聯邦學習框架,本地設備顯然無法提供如此規模的硬件資源。
而如果是使用減枝、量化、知識蒸餾等傳統模型壓縮方法,端側AI推薦引擎的準確率又會大打折扣。
因而,吳帆教授團隊借鑒聯邦學習的思路,研究出了一套適用于手機淘寶這樣“大模型”的端側推薦引擎構建機制:
第一步,將與用戶特征數據相關的局部模型切分下來,并將這個局部模型下載到本地結合本地數據進行模型訓練;
第二步,下載到本地的模型經由本地用戶數據訓練后,將本地參數根據本地模型特性和數據量進行加權計算;
第三步,加權計算后的本地參數上傳到云端,對云端全局大模型進行訓練。
在吳帆教授團隊的這套思路中,推薦模型同樣被切分為云端模型和(手機)本地模型,不同的是,云端模型是最終完整的“大模型”,手機本地模型則是根據每個用戶特征本地訓練形成的個性化用戶“小模型”。
據吳帆教授公開的研究數據顯示,每位用戶每個月關注的商品數大概在300個左右,因而手機本地的推薦模型大小只有0.27MB左右,甚至比輸入法的手機本地推薦模型還要小。
這正是淘寶在移動互聯網時代能夠精準掌握用戶購物習慣和用戶畫像的一個秘密武器。
03
手機大模型的歷史使命
現在再來看高通提出的手機大模型和混合AI這件事兒,似乎也沒有多高級。
畢竟,在過去這些年里,已經有不少團隊在嘗試將各類算法模型、推薦引擎放到手機上了。
那么,為什么這件事兒這么重要呢?
這是因為部署在云端的人工智能算法,在手機這類設備中應用時,存在三個問題:
第一,服務響應延時高;
第二,服務個性化不足;
第三,云服務器壓力大。
前兩者關乎用戶使用體驗,就像身處5G時代的我們,回過頭來看,已經完全無法忍受2G、3G時代時手機打開一個網頁都需要幾秒延時的體驗一樣。
喬布斯在2007年發布第一代蘋果手機時,現場演示手機沖浪,打開紐約時報時都需要讀秒,如果現在我們打開京東、淘寶、支付寶,首頁推薦內容需要讀秒才能呈現的話,那將是一個不敢想象的恐怖故事。
不過,端側AI更重要的意義,其實在于分擔云計算的壓力。
云計算是我們當下這個時代一項獨特的技術,它的出現讓我們能夠集中計算資源辦大事兒。然而,我們也看到,即便數據中心已經被納入到我們國家的新基建建設規劃之中,但是云計算資源依舊緊張。
尤其是大模型的出現,對計算資源提出了更高的要求,高通今年特別出了一份混合AI的研究報告,報告中援引摩根士丹利的數據指出:
生成式AI每次搜索的成本是傳統搜索方法的10倍,以目前每天超過100億次搜索計算為例,即便基于大語言模型的搜索僅占其中一小部分,每年增量成本也可能會達到數十億美元。
而作為如今每年擁有十幾億出貨量的個人終端,智能手機就像是擁有大量閑置算力的移動計算單元,如果能在這些設備閑置時間里將這些碎片化、分布式算力利用起來,將會產生不小的社會效益。
而這,或許才是手機大模型真正的歷史使命。
04
留給手機大模型的三個問題
2022年1月24日,中國工程院院刊舉辦第三屆信息與電子工程領域青年學術前沿論壇,彼時,還是阿里達摩院智能計算實驗室負責人的周靖人,對外發布了阿里的“洛犀”端云協同平臺。
這一平臺,背后是阿里達摩院、浙江大學上海高等研究院、上海人工智能實驗室三個國內頂級研究機構合作產物,其作用,正是實現端云協同的人工智能。
此外,據吳帆教授近日透露,吳帆教授團隊在端云協同AI上的工作,也被納入到了科技部2030人工智能重大專項的扶持項目之列。
不過,他也指出,目前端云協同AI仍然存在三方面難題:
第一,云上大模型與端側小模型之間的高效遷移問題;
第二,端側持續性增強學習所面臨的資源占用問題;
第三,端側新知識如何高效匯聚、融合到云測,支持云測大模型演進的問題。
2023年,大模型炸裂了整個科技圈,人們都驚訝地看著它肆無忌憚的表演,盡管大模型對計算資源有超高的需求,無論是入局大模型戰場的科技巨頭,還是創業團隊,都在瘋搶GPU資源,但這并不影響大模型在手機上的部署。
實際上,早在今年4月,也就是在高通在安卓手機上演示基于StableDiffusion的AI作圖沒多久,Midjourney就已經“落戶”QQ,QQ用戶就已經可以在手機端進入這一大火的AI作圖工具的“體驗服”。
這同樣是基于端云協同AI的一次嘗試。
高通今年提出的“年內在手機上支持100億級大模型”的目標,雖然聽上去有些不可思議,實則同樣是基于其提出的混合AI模式,也就是端云協同AI。
這么看來,大模型從未離開過智能手機這一刺激戰場,大模型也將繼續在擁有超過60億用戶的智能手機上繼續“強化學習”。