年初大模型剛剛熱鬧起來,和智能家居領域一些朋友聊天時,當時大家聊得最多的是——大模型要如何在智能家居行業(yè)落地。
中國企業(yè)一個很重要的特性就是“務實”。
或許很多技術并不是由國內企業(yè)或研究機構最先研究出門道的,但要說產業(yè)化速度,國內企業(yè)毫不遜色。
那么,大模型究竟要怎么用到智能家居領域呢?
大家討論來討論去,最后發(fā)現(xiàn),大(語言)模型在智能家居、乃至整個C端的應用,最契合的還是與智能語音交互結合。
畢竟,大模型(LLM)仍是自然語言處理(NLP)技術的一種。
而NLP是智能語音交互三大核心技術(ASR、NLP、TTL)中最重要的一環(huán),也是決定語音交互智能與否最重要的那項技術。
大模型在C端的“平民化”應用,從強語音交互產品開始。
這其中,亟需新技術補充彈藥的小度、天貓(精靈)們,終于等到了一波新機會。
01
智能音箱的盛世與衰落
論及消費級強語音交互產品,最為人熟知的,就是智能音箱。
無論是國外的蘋果、谷歌、亞馬遜,還是國內的百度、阿里、華為、小米,都曾將智能音箱作為一個核心產品來大手筆投入。
亞馬遜自不必說,作為智能音箱全球熱潮的始作俑者,亞馬遜研發(fā)語音交互技術的團隊在2017年超5000人,在2018年更是達到了萬人規(guī)模。
也正是由于亞馬遜這樣大手筆的投入,截至2019年1月,Alexa已經有超過70000項技能,搭載亞馬遜Alexa的智能硬件已經超過1億臺。
這樣的規(guī)模,引得不怎么涉足硬件領域的谷歌,也基于Google Asistant推出了智能音箱。
當時還沒退休的亞馬遜創(chuàng)始人貝索斯甚至多次指出,要將Alexa打造成亞馬遜繼電商、Prime、AWS后的第四大支柱產業(yè)。
國內智能語音技術熱潮更瘋狂,尤其是在智能音箱領域。早在2017年國內智能音箱市場混戰(zhàn)時,曾一度涌現(xiàn)出上百家智能音箱廠商,也造就了中國智能音箱“百箱大戰(zhàn)”的慘烈局面。
在智能音箱市場即將觸頂?shù)?019年,全球智能音箱銷量達到了1.47億,其中中國智能音箱市場出貨量5200萬臺。
中國市場占去了全球三分之一的智能音箱出貨量。
從Strategy Analytics的2019年Q4全球統(tǒng)計數(shù)據(jù)來看,全球3、4、5位分別為阿里、百度、小米,僅排在亞馬遜、谷歌之后,而上榜前六的廠商,均為全球科技巨頭。
然而,智能語音技術并沒有想象得那么好做。
一邊是消費者既享受著價格戰(zhàn)帶來的平民級AI產品,又因智能音箱不智能而苦不堪言;
另一邊是科技巨頭既要大手筆投入推動技術研發(fā),又要兼顧安全風險。
亞馬遜就曾因在全球雇傭數(shù)千人團隊為Alexa做數(shù)據(jù)標注,引發(fā)了2019年全社會關注的智能音箱“監(jiān)聽”事件。
智能音箱生意在走過第一個瘋漲的五年后,最終開始轉頭向下,銷量一路下滑。
就最近兩年來看,即便當初一年要辦多場智能音箱新品發(fā)布會的百度和阿里,現(xiàn)在也很少會花精力單獨為某款智能音箱出世舉辦大型發(fā)布會。
一則是頭部效應已經成形,二則是智能音箱已經盛世不再。
行業(yè)從業(yè)者能夠明顯感受到的是,智能音箱賽道已經不再性感、不再有趣。
直到大模型的出現(xiàn)。
02
舊瓶裝新酒
2022年年底,ChatGPT問世,兩個月破億活躍用戶,刷新了最快用戶增長紀錄,也引起了全球的關注。
紅杉沈南鵬是在ChatGPT發(fā)布前見到位于硅谷的OpenAI團隊,之后便開始在AI領域下重注。
在ChatGPT發(fā)布前三個月,紅杉已經在官網上發(fā)布了名為《Generative AI: A Creative New World》的文章,文章中預言,生成式AI將在未來進入到每個人的工作、娛樂、生活中。
在ChatGPT正式問世后,也就是2023年年初的兩個月里,無論是國內媒體,還是AI領域的投資人、從業(yè)者,都開始高度關注著大洋彼岸這款產品的問世、成長。
越來越多投資圈、科技圈大佬親自跑到硅谷,只為親身感受這波AI浪潮,探究背后究竟有無逆天機遇。
出門問問創(chuàng)始人李志飛,也是在2023年年初親身到硅谷考察后,決心要做大模型。
在上一個智能語音技術狂潮的智能音箱百箱大戰(zhàn)中,出門問問也曾做過智能音箱,而且是其中明星創(chuàng)業(yè)團隊之一。
只不過后來在巨頭價格戰(zhàn)的擠壓下,出門問問和其他大多數(shù)創(chuàng)業(yè)團隊一樣,在國內將這塊業(yè)務早早轉向了B端市場。
之后,李志飛和他的出門問問,依然一直留在智能語音技術這片熱土上。
大模型的出現(xiàn),讓李志飛們嗅到了機會,只是,2023年的大模型還存在一個公認的缺陷——“編瞎話”。
這一特性決定了大模型最先商業(yè)化落地的場景,會有這樣兩個特性:
第一,對自然語言處理技術有強需求;
第二,場景容錯率要高。
這其實也是過去這些年人工智能技術商業(yè)化落地普遍存在的兩個需求。
語音助手在智能手機沒有得到廣泛應用,卻催生了智能音箱這一“新物種”,正是因為后者對自然語音處理技術有較強的需求;
產業(yè)性需求更高的AI質檢,即便已有落地應用,仍需要有人工做二次復判,而娛樂性更強的下棋機器人卻更容易直接落地,正是因為后者的場景容錯率更高。
再看如今的大模型賽道。
雖然行業(yè)大模型潛力巨大,也通過具身智能帶火了人形機器人,然而,一位機器人領域資深從業(yè)者告訴鋅產業(yè),將大模型與機器人技術結合,現(xiàn)在仍處于探索階段。
“在解決大模型邊界問題(什么時候開始編瞎話)之前,沒人敢將搭載大模型的機器人批量應用到工廠核心業(yè)務中?!?/span>
因而,當ChatGPT問世后,最先用到大模型的,同樣是是兼具上述兩個特性的搜索引擎。
微軟不惜130億美元投資OpenAI,盤活了微軟Bing搜索引擎,也讓搜索引擎市場有了新的變數(shù)。
與此同時,智能音箱,成了具備上述兩個特性,也極度渴望新變數(shù)的另一類消費產品。
03
登船AIGC
2023年,經歷了三年銷量下行后的智能音箱市場,重新燃起了生機。
2023年2月9日,距離百度大模型——文心一言正式發(fā)布還要35天,然而,小度已經等不及文心一言發(fā)布,在這一天正式官宣將融合文心一言能力打造面向智能設備場景的大模型——小度靈機。
彼時,小度官方稱,小度靈機將會應用到小度全系產品中。
之后我們看到,小度陸續(xù)對外公布了“小度靈機”的測試結果,并率先應用到了5月發(fā)布的小度手機上,成了小度首款面向教育領域的智能手機最大的亮點。
今年7月在接受媒體采訪時,小度科技CEO景鯤再次強調,“我們會將大模型的能力逐步應用到小度更多產品上,并會針對使用場景不斷調優(yōu)。 ”
不過,景鯤也指出,“它短期內不會有太大改變,3個月、6個月后,可能還是原來那些服務?!?/span>
阿里的語音交互系統(tǒng)接入大模型,同樣是在阿里大模型發(fā)布之前。
2023年4月11日,在這一年的阿里云峰會上,阿里正式對外發(fā)布大模型通義千問,當時還是阿里CEO的張勇稱,未來阿里旗下所有產品將接入通義千問。
實際上,在阿里通義千問大模型發(fā)布之前,網上就已經出現(xiàn)了接入大模型的天貓精靈的內測視頻,官方當時確認了這一消息,并稱這背后的是“個性化大模型。”
阿里大模型在天貓精靈智能音箱上對外的內測招募是在通義千問大模型發(fā)布之后,與此同時,天貓精靈在今年4月對外發(fā)布了首款搭載大模型的消費級產品——智能眼鏡。
相較于百度、阿里,小米大模型正式對外亮相要更晚一些。
2023年8月14日,在今年雷軍年度演講上,雷軍對外公布了小米大模型研發(fā)近況,并宣布小愛同學正式接入小米AI大模型。
隨后,接入大模型的小愛同學正式開啟邀請,當時邀測的主要是多個型號的智能手機,以及小米Sound智能音箱。
至此,國內音箱三巨頭再次齊上陣,一并跨入了AIGC新戰(zhàn)場。
04
當大模型,開始“平民化”
2023年,“百模大戰(zhàn)”溢于紙面。
在經歷了第一波通用大模型之戰(zhàn)后,如今更多團隊尋找實際場景進行大模型的應用落地。
鮮為人知的是,大模型并不是什么新鮮事物,阿里通義、百度文心、華為盤古等現(xiàn)在市面上知名度較高的這些大模型,早幾年就已經在各公司內部立項推進,甚至嘗試進入應用場景。
例如,華為盤古大模型早在2021年就與中科院上海藥物研究所合作訓練出了盤古藥物分子大模型,并用在了藥物研發(fā)上。
ChatGPT更多是讓大模型從幕后走到臺前,并成為人工智能幾條技術路線中出奇制勝的一條路線。
在進入實際應用側時,大模型又一分為二,有了面向商業(yè)領域(To B)的行業(yè)大模型,以及面向消費市場(To C)的大模型和AIGC。
就在上周,天貓精靈換上了一個新的主品牌——未來精靈,這一品牌的掌舵人彭超用一場線上發(fā)布會宣告了天貓精靈全面駛入AIGC新時期。
迅速卷入這一戰(zhàn)場的不只有天貓精靈,甚至不只有BAT在內的幾家大廠,國內學術圈、產業(yè)圈眾多大佬都已經跑步入場。
只不過,如今已經擁有億級市場保有量的智能音箱,必將又一次成為大模型的絕佳試驗場。
而在智能音箱上的普及應用,也將是大模型這一人工智能技術再一次直面數(shù)億挑剔的民眾。
更值得關注的或許是:
在經歷過亞馬遜“監(jiān)聽”事件全球熱議后,這一次,大佬們能多留些精力兼顧隱私安全問題。