4月11日上午,北京國家會議中心,阿里云峰會。阿里巴巴自研GPT大模型終于揭下神秘面紗。
這也是繼百度“文心一言”之后,第二個由科技巨頭主導(dǎo)并對外發(fā)布的國產(chǎn)大模型。雖然目前360等企業(yè)同樣推出了類ChatGPT產(chǎn)品,但百度與阿里作為消費互聯(lián)網(wǎng)和云計算領(lǐng)域的龍頭企業(yè),無疑被視為大模型之戰(zhàn)中,現(xiàn)階段實力最為強勁的玩家。
(資料圖片僅供參考)
在公開亮相之前,阿里方面對“通義千問”的相關(guān)信息保持著低調(diào)。
此前,阿里云公眾號曾在4月7日發(fā)布邀測文章,但很快又進(jìn)行了刪除,拿到邀請碼的用戶并不多。
隨后在4月8日舉行的一場AI大模型行業(yè)論壇上,阿里云達(dá)摩院語言技術(shù)實驗室負(fù)責(zé)人黃非原定作為倒數(shù)第二位嘉賓上場,分享《通義大模型體系及應(yīng)用》。不過,最后黃非并未如期出席。
可以說,關(guān)于通義千問最重要的信息,都被留在了這場令人矚目的峰會上。
阿里如何盤算通義千問?
通義千問發(fā)布之后,阿里云下一步的動作是什么?未來要怎么做大模型?與其他大模型相比,通義千問有哪些特色?這無疑是本屆云峰會上最大的看點。
在峰會上,阿里云CEO張勇和CTO周靖人揭示了這三個問題的答案。
張勇提到,在未來阿里云將推出一系列AI大模型及圍繞模型的服務(wù)。在這個產(chǎn)品體系中,通義千問僅是其中一種產(chǎn)品選擇。
實際上,早在2022年9月舉辦的世界人工智能大會上,阿里云就發(fā)布了“通義”大模型系列。通義千問是這一系列中的“新成員”。
張勇還宣布,阿里所有產(chǎn)品未來將接入大模型,進(jìn)行智能化升級,包括天貓、釘釘、高德地圖、淘寶、優(yōu)酷、盒馬等。不過,會后周靖人在采訪環(huán)節(jié)表示,阿里全線產(chǎn)品接入大模型還沒有具體的時間表。
同時,阿里云還將積極推動企業(yè)客戶接入大模型,他提到:“今天,阿里云將把這些AI基礎(chǔ)設(shè)施和大模型能力向所有企業(yè)開放,共同推動AI產(chǎn)業(yè)的發(fā)展。”
目前,阿里云已經(jīng)與多家企業(yè)展開了合作探索,包括OPPO安第斯智能云、太平洋保險、吉利汽車、上汽、奇瑞汽車、毫末智行、太古可口可樂、波司登、掌閱科技等等。
▲(大模型將接入阿里所有產(chǎn)品,圖源/市界攝于阿里云峰會)
周靖人展示,通義千問具有多輪對話、文案創(chuàng)作、邏輯推理、多模態(tài)理解、多語言支持等能力。不過據(jù)「市界」對通義千問的試用,當(dāng)前版本的模型還不具備文字之外的多模態(tài)內(nèi)容生成、理解能力。
對此周靖人說道:“目前我們開放了通義千問作為語言模型的原始能力,今后我們還會逐漸將搜索、知識增強等能力接入到通義千問的產(chǎn)品體系中,不斷對產(chǎn)品體系進(jìn)行升級。此外為了更好地使用千問,我們還需要不單單以web的形式與千問進(jìn)行交流、提問,為了便于開發(fā)者去實現(xiàn)一系列應(yīng)用,我們還將提供多種模型的接入、調(diào)用方式,用簡單的API的方式去實現(xiàn)這樣的能力。”
換句話說,通義千問未來將像ChatGPT、GPT-4一樣,提供插件功能,允許開發(fā)者進(jìn)行個性化開發(fā)、形成產(chǎn)品生態(tài)。
▲(當(dāng)前版本的通義千問還不具備圖片生成能力,圖源/通義千問)
此外,周靖人還介紹了阿里云在訓(xùn)練、部署大模型背后的技術(shù)支撐,并從模型訓(xùn)練、模型推理、模型服務(wù)的成本三方面分別進(jìn)行闡述。
據(jù)其分享,針對模型訓(xùn)練任務(wù),阿里云啟動了靈駿計算集群進(jìn)行算力、存儲支撐,靈駿平臺能夠支撐10萬張GPU卡的計算規(guī)模,并實現(xiàn)低延遲互聯(lián)。
推理方面,阿里云可以把模型部署在全球28個地域。同時,為了降低模型服務(wù)成本,阿里云可通過對模型的壓縮,將成本降低至1/8。
張勇在阿里云的第一戰(zhàn)
在通義千問發(fā)布之后,阿里云還將有一系列新動作,包括在4月18日發(fā)布行業(yè)大模型,以及尚未公布舉辦時間的生態(tài)大會——峰會上,張勇透露阿里云會在生態(tài)大會上提出全新生態(tài)戰(zhàn)略。
接下來緊鑼密鼓的新產(chǎn)品和戰(zhàn)略發(fā)布,也意味著張勇和阿里云緊繃的“弦”,還不能松懈下來。
這個4月對于阿里巴巴來說頗不平靜:創(chuàng)始人馬云回國引發(fā)大量關(guān)注,一號位張勇官宣組織大變陣造成的熱議仍在坊間流傳……每個人都在關(guān)心,這家龐大的商業(yè)體下一步將要做些什么、去往何方。通義千問正是在這樣的背景中亮相。
“張勇看起來又老了。”在云峰會會場中,一位熟悉阿里云的人士對「市界」說道。
在會上張勇也坦言:“(這個4月)對我來說也是一個全新開始,大家都知道,年初我躬身入局,親自帶隊阿里云業(yè)務(wù)。”
從各個角度而言,大模型通義千問都在阿里云內(nèi)部獲得了極高的優(yōu)先級。
據(jù)一位阿里員工告訴「市界」:“這段時間雖然阿里云研發(fā)人員很少直接見到老逍,但后者一直在親自盯云業(yè)務(wù)線,主要對接云業(yè)務(wù)的高層(注:張勇花名為逍遙子)。”
無論是從技術(shù)迭代浪潮的沖刷,還是從阿里自身來考慮,入局NLP大模型都是阿里云不得不打的一場仗。
▲(圖源/市界攝于阿里云峰會)
一方面,OpenAI發(fā)布的ChatGPT為整個行業(yè)做了議程設(shè)置。為了追趕大洋彼岸的強勁對手、不錯過對NLP階段性關(guān)鍵產(chǎn)品的攻城略地,包括阿里云在內(nèi)的科技巨頭們只能奮起直追。
特別是對阿里云來說,其在發(fā)布國產(chǎn)NLP大模型方面的時間表,已經(jīng)比百度晚了一步。
在大模型的搶灘期,越早發(fā)布產(chǎn)品,意味著能夠越早與企業(yè)伙伴達(dá)成合作。3月16日,百度舉辦大模型發(fā)布會時,官方數(shù)據(jù)稱已有650家企業(yè)宣布接入文心一言。在拓展模型生態(tài)方面,阿里云或已落在后頭。
另一方面,對于阿里云和整個阿里集團(tuán)而言,面對消費互聯(lián)網(wǎng)發(fā)展空間越發(fā)狹窄、產(chǎn)業(yè)互聯(lián)網(wǎng)增長遭遇瓶頸的現(xiàn)實,找到新的增長引擎更是十分緊迫。
2022年12月29日,張勇發(fā)出全員郵件,將新一年的關(guān)鍵字定為“進(jìn)”,而上一年的關(guān)鍵字是“定”。同樣是在這封郵件中,張勇宣布自己將直接兼任阿里云總裁的職位。
從“定”到“進(jìn)”的轉(zhuǎn)變過程中,大模型成為這家云計算巨頭不能錯過的風(fēng)口。
面對友商在大模型市場中的競爭和開拓大模型市場的挑戰(zhàn),阿里云在峰會上提到將全力投入AI建設(shè)。不過,周靖人表示,全力投入并不是不計成本all in AI ,“阿里云在智能方面的投入沒有改變,我們一直是云智一體,不是all in,而是一如既往地投入……我們一直在做深度研發(fā),策略沒有改變”。
此前,周靖人也曾在接受品玩采訪時提到:“通義千問是我們的一個中間態(tài)……它不是起點也不是終點,是個既定路線上的節(jié)點。我們這次是把過去積累的一部分工作向社會,向開發(fā)者開放。”
作為對比,百度在3月16日發(fā)布文心一言時,稱文心一言對標(biāo)的是2022年11月的ChatGPT版本。而阿里云并未公布通義千問對標(biāo)的行業(yè)產(chǎn)品。
為了不斷逼近“既定路線”上的目標(biāo),阿里云還需要不斷推進(jìn)“中間態(tài)”模型的迭代,以及拓展模型應(yīng)用生態(tài)。
大模型賽道卷起來了
從2022年末至今,由ChatGPT掀起的大模型爭霸賽愈演愈熱,下場選手已經(jīng)越來越多。
就在阿里云峰會舉辦前兩天的4月9日,360宣布基于360GPT大模型開發(fā)的人工智能產(chǎn)品矩陣“360智腦”率先落地搜索場景,將面向企業(yè)用戶開放內(nèi)測。
緊隨其后,“港股AI第一股”商湯科技在4月10日發(fā)布了名為“日日新SenseNova”的大模型體系。該體系下的千億級語言大模型“商量SenseChat”號稱擁有多輪對話和超長文本理解能力。
接下來,知乎、科大訊飛等企業(yè)將發(fā)布AI技術(shù)進(jìn)展或相關(guān)戰(zhàn)略。美團(tuán)聯(lián)合創(chuàng)始人王慧文創(chuàng)辦的光年之外、搜狗創(chuàng)始人王小川創(chuàng)辦的百川智能……許多創(chuàng)企同樣瞄準(zhǔn)了這條賽道。
另外,盡管華為、京東、騰訊等大廠尚未對外公開發(fā)布大模型產(chǎn)品,這些企業(yè)均有相應(yīng)的技術(shù)布局。
AI從業(yè)者蒙靈告訴「市界」:“我們業(yè)內(nèi)的人都在調(diào)侃,NLP大模型的市場還沒來得及‘變藍(lán)(海)’,可能就要‘紅(海)’了。”
扎堆涌入的大小市場參與者,都在押寶一種名為MaaS(模型即服務(wù))的商業(yè)模式。也就是如同SaaS、PaaS等云計算商業(yè)模式一樣,允許客戶利用大模型底座打造出個性化功能。李彥宏曾對此預(yù)測:“之前企業(yè)選擇云廠商更多看算力、存儲等基礎(chǔ)云服務(wù)。未來,更多會看框架好不好、模型好不好,以及模型、框架、芯片、應(yīng)用這四層之間的協(xié)同。”
▲(圖源/市界攝于阿里云峰會)
但同時,市場普遍認(rèn)為大模型市場將迎來激烈的競合,最終僅留下少量玩家。如OpenAI(ChatGPT的發(fā)布方)創(chuàng)始人Sam Altman曾經(jīng)的預(yù)測:“將來應(yīng)該會出現(xiàn)幾個大型的基礎(chǔ)模型,開發(fā)人員都將基于這些基礎(chǔ)模型研發(fā)AI應(yīng)用。”
華為云人工智能領(lǐng)域首席科學(xué)家田奇也曾提出,未來“大模型將成為應(yīng)對AI領(lǐng)域應(yīng)用碎片化的一種方式,相較于此前不同場景對應(yīng)不同小模型的狀況,未來大模型有可能收編高度定制化的小模型,導(dǎo)致市場向大公司集中”。
另外,還有聲音認(rèn)為大模型并非解決所有商業(yè)問題的最佳解。
一家AI創(chuàng)企業(yè)務(wù)負(fù)責(zé)人告訴「市界」:“在很多的應(yīng)用場景中,并不需要用大模型來解決問題,用一個小模型、中模型就能把問題解決得很好,所以說殺雞焉用牛刀?況且中小企業(yè)客戶的付費能力無法支撐接入大廠大模型。那未來應(yīng)該怎么辦?是像當(dāng)初云計算市場一樣,先用ToC打法去燒錢搶市場還是有新的玩法,我們都不知道。”
無論如何,一場全球科技企業(yè)都積極參與的AI爭霸賽已然開始。
在阿里云峰會上,張勇說道:“所有行業(yè)和服務(wù)都值得重新做一遍。”但在重新定義千行百業(yè)的商業(yè)模式之前,還有許多問題需要解決。通義千問、文心一言或許都僅是一個開始。
作者 | 董溫淑
編輯 | 董雨晴


