由ChatGPT掀起的大模型熱潮仍在席卷,科技巨頭們正摩拳擦掌爭先涌入這條賽道,沒有人甘愿放棄這場角逐賽。
繼3月份百度推出“文心一言”、4月初阿里云達(dá)摩院開啟“通義千問”外部測試之后,華為云也要下場了。
(資料圖)
華為云官網(wǎng)顯示,其自研的大模型“盤古”即將對外上線,但并未顯示具體的上線時間。
4月8日上午,華為云人工智能領(lǐng)域首席科學(xué)家田奇現(xiàn)身《人工智能大模型技術(shù)高峰論壇》,分享了華為云盤古大模型的進(jìn)展及其應(yīng)用。
據(jù)悉,田奇是美國伊利諾伊大學(xué)香檳分校博士、IEEE Fellow(美國電子電氣工程師學(xué)會會士),也是原德州大學(xué)圣安東尼奧分校計算機(jī)系正教授。2020年3月起,田奇加入華為云,參與了盤古大模型立項至今的研發(fā)進(jìn)程。
最強(qiáng)大的國產(chǎn)ChatGPT?
事實上,盤古大模型在兩年前就曾公開亮相,但未曾開放外部使用。
早在2021年4月,剛剛接任華為云CEO的余承東在HDC華為開發(fā)者大會上宣布“華為云盤古系列AI大數(shù)據(jù)模型”正式發(fā)布。彼時余承東自信表示:“這是今天最重磅的產(chǎn)品。”
根據(jù)公開信息,華為云從2020年9月就開始推動盤古大模型項目的立項,并在2020年11月內(nèi)部立項成功。
最初發(fā)布時,該系列模型中共包括四個子模型,分別為:NLP(自然語言處理)大模型、CV(計算機(jī)視覺)大模型、多模態(tài)大模型、科學(xué)計算大模型。
其中NLP正是ChatGPT、文心一言、通義千問等近期走紅的大模型所屬的技術(shù)領(lǐng)域。盤古NLP大模型是由華為云、循環(huán)智能和鵬城實驗室聯(lián)合開發(fā),被稱為是業(yè)界首個千億參數(shù)的中文預(yù)訓(xùn)練大模型。
在2021年4月正式亮相后,盤古系列大模型仍在持續(xù)更新。根據(jù)田奇分享,2021年9月,華為云發(fā)布了盤古藥物分析大模型;2022年6月,華為云發(fā)布了盤古礦山大模型;2022年11月,盤古氣象大模型、盤古海浪大模型、盤古金融OCR大模型同期亮相。
▲(華為云盤古大模型發(fā)展歷程,圖源/人工智能大模型技術(shù)高峰論壇)
在4月8日上午的演講中,田奇主要提及了盤古CV大模型、科學(xué)計算大模型等的具體應(yīng)用,對盤古NLP大模型僅以寥寥數(shù)語帶過:“NLP大模型來講的話,我們?nèi)ツ杲桓读艘粋€阿拉伯語的千億級大模型,也在一些榜單上取得了比較好的成績,同時去年在備案檢索方面、在中國智能技術(shù)評測中也取得了第一的成績。”
盡管仍稍顯神秘,華為云的大模型已吸引了眾多眼球。西南證券研報寫到:“盤古大模型將是超過任何其他類似應(yīng)用的最先進(jìn)、最強(qiáng)大的自然語言處理應(yīng)用?!?/p>
民生證券研報同樣曾指出:“(華為云盤古大模型)是目前最接近人類理解水平的預(yù)訓(xùn)練模型。將通用知識與行業(yè)經(jīng)驗相結(jié)合,在生成與理解性能上處于領(lǐng)先地位?!?/p>
華為盤古,劍指AI碎片化場景應(yīng)用
在分享中,田奇將華為云盤古大模型在過去一年的實踐總結(jié)為:“在2022年的話,主要是做好行業(yè)應(yīng)用AI和Industry(工業(yè)),希望在煤礦、水泥、電力、金融、農(nóng)業(yè)創(chuàng)造更多的產(chǎn)業(yè)價值來幫助客戶。”
未來,華為云盤古NLP大模型或?qū)⒃谥悄芪臋n搜索、智能ERP(企業(yè)資源計劃)、小語種大模型等行業(yè)或領(lǐng)域率先落地。田奇稱:“業(yè)界預(yù)計人工智能的行業(yè)滲透率持續(xù)攀升,到2026年將達(dá)到20%。而隨著近期的AI大模型的爆發(fā),接下來滲透率提升可能進(jìn)一步提速?!?/p>
▲(圖源/人工智能大模型技術(shù)高峰論壇)
整體而言,華為云盤古大模型強(qiáng)調(diào)泛化能力、重點發(fā)展方向在于細(xì)分場景的落地應(yīng)用、賦能千行百業(yè)。與之對比,較早發(fā)布的百度文心一言更加強(qiáng)調(diào)在與用戶對話互動、協(xié)助創(chuàng)作、信息整合等方面的應(yīng)用。
行業(yè)觀察者張雪峰告訴「市界」:“不同企業(yè)的大模型在應(yīng)用場景、數(shù)據(jù)來源、算法模型等方面有所不同。這些模型的異同也反映了不同企業(yè)在技術(shù)積累和市場布局方面的差異?!?/p>
接下來,隨著商湯科技、科大訊飛等科技企業(yè)陸續(xù)推出相應(yīng)產(chǎn)品,大模型賽道將進(jìn)一步擁擠起來。
然而,盡管許多玩家同臺競技、試圖奪下一張參與全球技術(shù)浪潮迭代的“早鳥票”,市場普遍認(rèn)為未來大模型市場勢必將迎來新一輪的整合與洗牌。
如OpenAI(ChatGPT的發(fā)布方)創(chuàng)始人Sam Altman曾經(jīng)預(yù)測:“將來應(yīng)該會出現(xiàn)幾個大型的基礎(chǔ)模型,開發(fā)人員都將基于這些基礎(chǔ)模型研發(fā)AI應(yīng)用?!?/p>
田奇也在分享中提到,未來“大模型將成為應(yīng)對AI領(lǐng)域應(yīng)用碎片化的一種方式,相較于此前不同場景對應(yīng)不同小模型的狀況,未來大模型有可能收編高度定制化的小模型,導(dǎo)致市場向大公司集中”。
這場人工智能應(yīng)用角逐賽才剛剛開始。
作者 | 董溫淑
編輯 | 董雨晴


