過去一年,大語言模型的浪潮,讓越來越多人看到了通向通用人工智能的道路,整個科技界、產(chǎn)業(yè)界也非常興奮。數(shù)據(jù)顯示,目前中國10億參數(shù)規(guī)模以上的大模型已經(jīng)發(fā)布了70多個。
那么,大模型價值在哪?如何做出AI時代的爆款應(yīng)用?
卷大模型沒意義,卷應(yīng)用機(jī)會更大
【資料圖】
百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖表示,對于組織和企業(yè)來講,大模型會帶來新的智能生產(chǎn)范式。員工不用花大量的時間死記硬背常規(guī)的知識,有問題問大模型,大模型就會給出答案。同樣,大模型會改變?nèi)撕蜋C(jī)器之間的關(guān)系,可以顯著提升專家的工作效率,專家就可以把時間花在真正有創(chuàng)造性的工作上去,而且更主要的是大模型有強(qiáng)大的理解和生成能力,它能夠整合不同領(lǐng)域的知識,創(chuàng)造出前所未有的AI。
百度創(chuàng)始人、董事長兼首席執(zhí)行官在2023年百度云智大會上指出,模型本身并不直接產(chǎn)生價值,基于基礎(chǔ)大模型開發(fā)出來的應(yīng)用才是模型存在的意義。他認(rèn)為,對于創(chuàng)業(yè)者來說,卷大模型沒意義,卷應(yīng)用機(jī)會更大。就像移動互聯(lián)網(wǎng)時代,操作系統(tǒng)只有安卓和iOS,而特別成功的應(yīng)用有很多,只有在大模型的基礎(chǔ)之上,產(chǎn)生了足夠多的AI原生應(yīng)用,才是一個健康的生態(tài)環(huán)境。
李彥宏指出,AI原生應(yīng)用要能解決過去解決不了、或解決不好的問題,而不是對移動互聯(lián)網(wǎng)APP和PC軟件的簡單重復(fù)。他認(rèn)為,AI原生應(yīng)用應(yīng)該滿足三個基礎(chǔ)條件:一是能夠用自然語言交互,二是充分利用大語言模型的理解、生成、推理、記憶等能力,三是每個應(yīng)用的交互不超過兩級菜單,所以交互會更簡單。
百度的目標(biāo)是打造好大模型的基礎(chǔ)能力,支持好AI原生應(yīng)用開發(fā)。最新的文心大模型3.5版本,模型效果提升了50%,訓(xùn)練速度提升了兩倍,推理速度提升了30倍。不久后,百度將推出文心大模型4.0版本。文心大模型是最好的大模型之一,只有最好的大模型,才能長出最好的AI原生應(yīng)用。百度希望創(chuàng)業(yè)者在文心大模型之上,可以做出AI時代的爆款應(yīng)用。
沈抖堅信,2023年一定會成為AI原生業(yè)務(wù)的元年,在大模型推動下所有行業(yè)都會迎來深度重構(gòu),共同建立一個繁榮的大模型產(chǎn)業(yè)生態(tài),用更高效的算力基礎(chǔ)設(shè)施、更豐富的行業(yè)解決方案、更全面的全國服務(wù)網(wǎng)絡(luò),讓每一個行業(yè)、每一位客戶都能更好的駕馭大模型,實(shí)現(xiàn)規(guī)?;漠a(chǎn)業(yè)創(chuàng)新,讓大模型成為推動我國產(chǎn)業(yè)優(yōu)化升級、實(shí)現(xiàn)經(jīng)濟(jì)高質(zhì)量發(fā)展的新動能。未來將有更多偉大的產(chǎn)品和應(yīng)用誕生在百度的客戶和伙伴的手中。
大模型驅(qū)動云計算創(chuàng)新變革
在百度集團(tuán)副總裁侯震宇看來,作為基礎(chǔ)設(shè)施的云計算,在大模型的驅(qū)動下,AI原生應(yīng)用的引領(lǐng)下,它的發(fā)展從經(jīng)典的云逐步進(jìn)化到AI原生云,將會重塑云計算產(chǎn)業(yè)的格局,生成式AI大模型會催生一個研發(fā)的新范式。
第一,對AI原生應(yīng)用提出了新的架構(gòu)要求。構(gòu)建一個新的AI原生應(yīng)用一方面肯定是模型,需要有模型能力,模型能力將會以API調(diào)度的方式來提供服務(wù),這里的模型不止包括基礎(chǔ)大模型,同時也包括托管在百度平臺上的客戶經(jīng)過微調(diào)的自己的模型。無論是動態(tài)編排還是靜態(tài)編排,用大模型獨(dú)有的能力實(shí)現(xiàn)鏈?zhǔn)秸{(diào)用;另一方面,新的服務(wù)即MaaS能力將成為一個基礎(chǔ)性能力,MaaS需要具備豐富、易用和面向AI原生應(yīng)用的三個特點(diǎn),未來不可能有一個大模型解決所有的問題,最終落地到場景里面需要有不同模型組合滿足不同客戶在不同場景的需求。
第二,大模型平臺要足夠簡單易用,需要有全套的工具鏈覆蓋從數(shù)據(jù)收集、標(biāo)注到模型研發(fā)、訓(xùn)練、評估,進(jìn)而再到模型推理優(yōu)化的全生命周期。此外,數(shù)據(jù)對于AI的研發(fā)非常重要,平臺既要提供更多的數(shù)據(jù)集,同時平臺也應(yīng)該幫助客戶建立起屬于自己的數(shù)據(jù)驅(qū)動數(shù)據(jù)閉環(huán)的能力,更好地支持客戶的模型能力的迭代,以激發(fā)其業(yè)務(wù)更快速的發(fā)展。
第三,新計算大模型需要有大量數(shù)據(jù)的高密度計算,它對計算體系結(jié)構(gòu)帶來了新的要求。目前,計算負(fù)載在加速向異構(gòu)計算遷移,而且規(guī)模越來越大,微秒級互聯(lián)將成為算力規(guī)模化發(fā)展的關(guān)鍵能力,這些都需要從整個體系結(jié)構(gòu)的層面上用軟硬一體的思路和方法去解決。
大力開展基于國產(chǎn)AI芯片的大模型系統(tǒng)研究
中國工程院院士鄭緯民指出,在國外的GPU卡一卡難求(價格非常高),國產(chǎn)的卡不喜歡的情況下,除了要改變國產(chǎn)卡的生態(tài)系統(tǒng)不好的局面外,更要考慮大模型基礎(chǔ)設(shè)施平衡設(shè)計。
首先,半精度運(yùn)算性能與雙精度運(yùn)算性能的平衡。設(shè)計中不僅要考慮半精度運(yùn)算性能,還要考慮雙精度運(yùn)算能力,雙精度與半精度運(yùn)算性能之比為1:100比較合適。根據(jù)科學(xué)計算( AI For Science)和大模型訓(xùn)練的發(fā)展趨勢,變精度平衡設(shè)計的思想很重要,適應(yīng)科學(xué)計算和更廣泛的AI算法和應(yīng)用提供保障。
其次,網(wǎng)絡(luò)平衡設(shè)計。網(wǎng)絡(luò)設(shè)計不能只針對CNN算法,還需考慮極大規(guī)模預(yù)訓(xùn)練模型對系統(tǒng)的需求,大規(guī)模預(yù)訓(xùn)練模型需要高帶寬低延遲網(wǎng)絡(luò)。
再次,體系結(jié)構(gòu)感知的內(nèi)存平衡設(shè)計。針對環(huán)網(wǎng)、存控可能帶來的性能問題,可以利用核間通信輔助、排布核組訪存模式,兩種優(yōu)化方式可以帶來5.3倍性能提升。針對體系結(jié)構(gòu)特點(diǎn)設(shè)計應(yīng)用程序的訪存模式,最大化利用硬件性能。
最后,io子系統(tǒng)平衡設(shè)計。系統(tǒng)的本地nvme ssd僅通過本地文件系統(tǒng)訪問,限制了其應(yīng)用范圍。將每臺服務(wù)器上的快速本地nvme整合成應(yīng)用可見的全局分布式文件系統(tǒng)。
鄭緯民認(rèn)為,怎么讓一塊 GPU發(fā)揮兩塊、甚至三塊的能力?大模型基礎(chǔ)設(shè)施平衡設(shè)計的四點(diǎn)考慮做得好,相信別人要用1萬塊卡,我們用9000卡就可以了。
百度集團(tuán)副總裁袁佛玉認(rèn)為,大模型時代的生態(tài)體系,會有三個重大特點(diǎn)。第一,應(yīng)用生態(tài)的位置將更加核心;第二,擁有行業(yè)專業(yè)知識的企業(yè)迎來巨大機(jī)遇和挑戰(zhàn);第三,初創(chuàng)企業(yè)與開發(fā)者將帶動生成式AI的應(yīng)用繁榮。
第26屆論道啟動!11月相聚春城昆明,共尋智能視聽新增長。點(diǎn)擊圖片報名參會~
責(zé)任編輯:房家輝
分享到:版權(quán)聲明:凡注明來源“流媒體網(wǎng)”的文章,版權(quán)均屬流媒體網(wǎng)所有,轉(zhuǎn)載需注明出處。非本站出處的文章為轉(zhuǎn)載,觀點(diǎn)供業(yè)內(nèi)參考,不代表本站觀點(diǎn)。文中圖片均來源于網(wǎng)絡(luò)收集整理,僅供學(xué)習(xí)交流,版權(quán)歸原作者所有。如涉及侵權(quán),請及時聯(lián)系我們刪除!關(guān)鍵詞: