11月30日,由深度學習技術(shù)及應用國家工程研究中心主辦的WAVE SUMMIT+ 2022深度學習開發(fā)者峰會上,百度文心大模型再次升級,包括新增11個大模型,大模型總量增至36個,構(gòu)建起業(yè)界規(guī)模最大的產(chǎn)業(yè)大模型體系。
【資料圖】
不久前,百度聯(lián)合人民網(wǎng)發(fā)布媒體行業(yè)大模型“人民網(wǎng)-百度·文心”,這是領(lǐng)先的大模型技術(shù)在傳媒行業(yè)的首次嘗試,旨在順應內(nèi)容與技術(shù)發(fā)展,打造全媒體時代內(nèi)容科技創(chuàng)新引擎。
人民網(wǎng)-百度·文心大模型基于文心大模型ERNIE3.0,引入人民網(wǎng)在傳媒行業(yè)積淀的行業(yè)知識與任務樣本數(shù)據(jù),結(jié)合雙方在預訓練大模型技術(shù)和傳媒領(lǐng)域業(yè)務與算法的經(jīng)驗打造。
人工智能是基礎(chǔ)設施,大模型已成為新方向
近些年來,人工智能的應用日益廣泛,“十四五”期間,我國媒體融合發(fā)展進入新階段,雖然不同層級和形態(tài)的媒體深度融合、整體轉(zhuǎn)型形式多樣,但引入先進的互聯(lián)網(wǎng)技術(shù)已成為行業(yè)共識。5G、大數(shù)據(jù)、云計算、人工智能等新技術(shù)被應用到新聞采編播發(fā)的各個環(huán)節(jié),成為媒體智能化的基礎(chǔ)設施。
從內(nèi)容發(fā)展形態(tài)來看,當下從文字到圖文到視頻,多模態(tài)的內(nèi)容形式已成為常態(tài),傳播路徑越來越短,傳播速度越來越快。與之相伴的是,以移動終端為傳播介質(zhì)的新媒體成為傳媒輿論的主陣地,傳播形態(tài)和介質(zhì)的變化導致新聞傳播規(guī)則和評價標準隨之改變。
對傳統(tǒng)媒體來說,加碼技術(shù)領(lǐng)域的投入迫在眉睫。從技術(shù)發(fā)展趨勢來看,隨著數(shù)據(jù)井噴、算法進步以及算力突破,預訓練大模型已成為人工智能發(fā)展的新方向,基于大規(guī)模知識和海量無結(jié)構(gòu)數(shù)據(jù)融合學習、深度學習,在多模態(tài)內(nèi)容理解上具備更強的能力,在內(nèi)容生成上也有更好的表現(xiàn),可以進一步提升內(nèi)容創(chuàng)作效率,促進內(nèi)容生態(tài)繁榮。
在媒體轉(zhuǎn)型浪潮的初期,“造不如買、買不如租”是大多數(shù)媒體的選擇,隨著改革的深入,自主開發(fā)受到不少媒體的青睞,但是“造游艇”和“造航母”,畢竟完全不在一個數(shù)量級上,預訓練大模型雖然作用巨大、前景廣闊,但受技術(shù)復雜、研發(fā)周期長、投入成本高等因素的制約,絕大部分媒體都不可能獨自踏入這條賽道。
以百度為代表的大模型生產(chǎn)企業(yè),在大模型能力、海量數(shù)據(jù)、大規(guī)模算力等方面具有優(yōu)勢,能夠根據(jù)AI應用方的需求,自動化、標準化地進行多場景多領(lǐng)域的模型生產(chǎn),當達到一定規(guī)模時,即可形成健康、可持續(xù)發(fā)展的大模型產(chǎn)業(yè)模式。
“具有算法、算力和數(shù)據(jù)綜合優(yōu)勢的企業(yè),可以將模型生產(chǎn)的復雜過程封裝起來,通過低門檻、高效率的生產(chǎn)平臺,為千行百業(yè)提供大模型服務?!卑俣仁紫夹g(shù)官、深度學習技術(shù)及應用國家工程研究中心主任王海峰指出,如此一來,大數(shù)據(jù)、大算力、大模型能力僅需少數(shù)企業(yè)操心,千行百業(yè)直接應用AI模型即可。
王海峰提出的這條產(chǎn)業(yè)化路徑,是媒體轉(zhuǎn)型過程中一種可行的模式。龐雜的系統(tǒng)和復雜的研發(fā)流程,對以內(nèi)容見長的傳統(tǒng)媒體來說,不啻于一座大山,唯有借助合作伙伴的力量才有可能翻越。
值得一提的是,文心大模型與媒體行業(yè)的結(jié)合已經(jīng)在一些場景上帶來了新模式。傳媒內(nèi)參從百度方面獲悉,部分媒體“策、采、編、發(fā)”各個環(huán)節(jié)已采用人機協(xié)作的模式工作。此外,2022年北京冬奧會,大模型作為底層技術(shù)支持的AI數(shù)字人作為手語主播,為超過兩千萬的聽障人士觀看觀賽提供了高效、高質(zhì)量的服務。
內(nèi)容與技術(shù)的牽手:人工智能加持傳媒、大模型顯著提升行業(yè)效率
作為傳媒領(lǐng)域的AI基礎(chǔ)設施,百度與人民網(wǎng)計劃基于人民網(wǎng)-百度·文心大模型,打造全媒體時代內(nèi)容科技創(chuàng)新引擎,通過集約化的大模型建設,實現(xiàn)以一個傳媒行業(yè)大模型底座支持多個細分業(yè)務場景應用,加快傳媒行業(yè)融合發(fā)展的步伐。
在百度文心大模型的技術(shù)加持下,人民網(wǎng)首批將自主可控的大模型應用于業(yè)務之中,將打造全媒體時代內(nèi)容科技創(chuàng)新引擎,引領(lǐng)媒體行業(yè)的AI應用新方向。
在技術(shù)方面,以人民網(wǎng)-百度·文心大模型替換原有模型,在各類NLP(自然語言處理)場景上,顯著提升功能效果;在應用方面,集約化建設AI能力,突破效果瓶頸,實現(xiàn)更多傳媒業(yè)務場景的降本增效,如應用于文章摘要生成等內(nèi)容生成類場景。
人民網(wǎng)-百度·文心大模型已應用于人民網(wǎng)的新聞摘編報告生成、新聞內(nèi)容審核分類、輿情分析等重要場景上,取得了比較明顯的效果提升,大幅領(lǐng)先業(yè)界其他模型。
未來該模型還將用于新聞事件抽取分析、新聞評論聚合分析、新聞信息個性化推薦等更多領(lǐng)域,全面提升大模型對傳媒領(lǐng)域任務的適配能力,加快傳媒行業(yè)融合發(fā)展步伐。
百度集團副總裁、深度學習技術(shù)及應用國家工程研究中心副主任吳甜表示,百度與人民網(wǎng)的合作由來已久,此次聯(lián)合發(fā)布媒體行業(yè)大模型,是人工智能前沿技術(shù)在媒體行業(yè)的最新實踐成果。
人民網(wǎng)輿情數(shù)據(jù)中心相關(guān)負責人表示,人民網(wǎng)輿情數(shù)據(jù)中心一直著力打造“輿情領(lǐng)航者”、“數(shù)據(jù)國家隊”和“數(shù)字經(jīng)濟高端智庫”,依托人民網(wǎng)在內(nèi)容科技戰(zhàn)略上的整體布局,積極探索AI技術(shù)在輿情場景的應用,推動輿情服務由人力密集型向智能密集型轉(zhuǎn)變。希望此次與百度在傳媒行業(yè)大模型的共建中能發(fā)揮雙方優(yōu)勢,加速人工智能新技術(shù)在媒體行業(yè)落地。
大模型背后的底氣:技術(shù)賦能多個行業(yè)、應用版圖不斷擴大
文心大模型是百度自主研發(fā)的產(chǎn)業(yè)級知識增強大模型體系,全景圖由模型層、工具與平臺層、產(chǎn)品與社區(qū)層構(gòu)成。
在模型層,文心大模型已經(jīng)包括36個大模型,涵蓋基礎(chǔ)大模型、任務大模型、行業(yè)大模型的三級體系,全面滿足產(chǎn)業(yè)應用需求,構(gòu)建了業(yè)界規(guī)模最大的產(chǎn)業(yè)大模型體系;在工具與平臺層,通過大模型開發(fā)套件、文心API和提供全流程開箱即用大模型能力的EasyDL和BML開發(fā)平臺,全方位降低應用門檻;產(chǎn)品與社區(qū)層,包括AI藝術(shù)與輔助創(chuàng)作平臺“文心一格”、產(chǎn)業(yè)級搜索系統(tǒng)“文心百中”和旸谷社區(qū),讓更多人零距離感受到最先進的AI大模型技術(shù)帶來的新體驗。
以ERNIE為代表的基礎(chǔ)大模型是文心大模型最重要的基礎(chǔ),也是百度開展的歷史最悠久的模型。從2019年至今,ERNIE已經(jīng)迭代到了3.0版本,每一個大版本都有基礎(chǔ)技術(shù)的創(chuàng)新。人民網(wǎng)-百度·文心大模型正是基于文心ERNIE 3.0打造。
作為百億參數(shù)知識增強的大模型,文心ERNIE 3.0首次在百億級預訓練模型中引入大規(guī)模知識圖譜,促進了結(jié)構(gòu)化知識和無結(jié)構(gòu)文本之間的信息共享,大幅提升了模型對于知識的記憶和推理能力。相比較于沒有知識增強的大模型,文心大模型的學習效率更高,且在實體問答、知識預測、可控文本生成等多個場景上擁有更好的效果。
文心大模型在產(chǎn)業(yè)應用過程中打磨技術(shù),并致力于持續(xù)降低應用門檻,推動產(chǎn)業(yè)智能化升級。
目前,文心大模型已大規(guī)模應用于百度搜索、信息流、智能音箱等互聯(lián)網(wǎng)產(chǎn)品,顯著提升了百度的產(chǎn)品效果和用戶體驗。從外部落地應用來看,文心大模型已通過飛槳開源開放平臺、百度智能云等賦能到工業(yè)、能源、金融、通信、媒體、教育等多個行業(yè)。
在媒體行業(yè),文心大模型的理解和生成創(chuàng)作能力激發(fā)創(chuàng)意,提升內(nèi)容多樣性,可降低制作成本;在保險領(lǐng)域應用中,文心大模型的智能解析能力,能使文本處理效率提升30倍;在醫(yī)療領(lǐng)域應用中,文心大模型將每份病歷的檢查時間,從30分鐘縮短到了秒級別……
從技術(shù)研發(fā)到落地應用,大模型發(fā)展已經(jīng)進入產(chǎn)業(yè)落地的關(guān)鍵期,與產(chǎn)業(yè)場景需求的高度契合是大模型真正助力產(chǎn)業(yè)發(fā)展的重要前提。聯(lián)合行業(yè)頭部企業(yè)研制行業(yè)大模型就是百度文心的重要實踐。隨著人民網(wǎng)的加入,文心大模型再添新成員,應用版圖進一步擴大。截至目前,文心已累計發(fā)布11個行業(yè)大模型,涵蓋電力、燃氣、金融、航天、傳媒、城市、影視、制造、社科等領(lǐng)域,實現(xiàn)顯著的效果提升,產(chǎn)業(yè)生態(tài)初步形成。
責任編輯:李楠
分享到:版權(quán)聲明:凡注明來源“流媒體網(wǎng)”的文章,版權(quán)均屬流媒體網(wǎng)所有,轉(zhuǎn)載需注明出處。非本站出處的文章為轉(zhuǎn)載,觀點供業(yè)內(nèi)參考,不代表本站觀點。文中圖片均來源于網(wǎng)絡收集整理,僅供學習交流,版權(quán)歸原作者所有。如涉及侵權(quán),請及時聯(lián)系我們刪除!