撰文|懂懂??????
編輯 | 秦言
【資料圖】
出品|懂懂筆記2018 年我們用手機刷著抖音的時候,絕對想不到短短幾年時間,視頻會發(fā)展如此之快,在我們的生活、工作中已經(jīng)無處不在。
購物都是看直播,春晚可以邊看邊“玩”,在線教育上大課、小課都很輕松,身處異地也可以多人連線K歌……
作為一個普通的用戶,這幾年可以感受到視頻的快速發(fā)展,以前很多不能實現(xiàn)的場景,慢慢來到我們的生活中,甚至很多超出想象的場景,也在不斷被制造出來。生活、工作的方式,正在逐漸被視頻所改變。
前臺的內(nèi)容越精彩、形態(tài)越豐富,后臺就需要越強大的技術(shù)支撐。當“行業(yè)+視頻”成為新常態(tài),視頻云也正在成為智能社會的新基建。
抖音用戶的流暢體驗,背后是億級DAU打磨的火山引擎視頻云。一方面其技術(shù)能力快速成長,滿足平臺不斷創(chuàng)新應用的需求,另一方面其也在將這種行業(yè)領(lǐng)先的能力外溢,幫助更多的企業(yè)、行業(yè)創(chuàng)新。
“當下,視頻化是數(shù)字時代的重要特征,正在為全行業(yè)輸出商業(yè)創(chuàng)新與變革的源動力,重塑工作模式與商業(yè)邏輯?!被鹕揭婵偛米T待在火山引擎視頻云&AIGC技術(shù)大會表示。
「01」
超視頻時代:助力千行百業(yè)體驗創(chuàng)新
不知不覺,你發(fā)現(xiàn)在萬物互融時代,人人看視頻,人人發(fā)視頻,萬物皆可拍,萬物皆可播,正在進入超視頻時代,視頻對社會的影響在不斷加深,正在改變?nèi)藗兩?、工作的方式?p>過去幾年,在C端應用中視頻已經(jīng)幾乎成為了標配,手機中的社交、資訊、電商、音樂等各類應用都開始增加不同形式的視頻功能,因視頻的直觀、生動、豐富,已經(jīng)成為增強用戶粘性的必要手段。據(jù)統(tǒng)計,TOP100 APP中搭載了點播、直播或?qū)崟r音視頻功能的比例高達69%。如今,視頻化的趨勢已經(jīng)蔓延到B端。無論是從行業(yè)競爭,還是從用戶體驗來看,每一個行業(yè)、每一個企業(yè)都有迫切創(chuàng)新的需求。人們常說,AI把每一個行業(yè)重新做一遍,事實上視頻也正在催生這種變化,把每個行業(yè)都重新做一遍。因為視頻,一些行業(yè)的運行模式在發(fā)生變化,用戶的使用方式也在隨之而變。
2022年中國視頻直播帶貨規(guī)模約3.5萬億元,在整個網(wǎng)上零售額中占比達到25.4%。每一個品牌、商家都將直播帶貨視為重要的營銷手段,看直播也成為消費者購買決策的重要渠道。
旅游行業(yè),短視頻、直播帶火了多個城市、無數(shù)個景點。到網(wǎng)紅景點打卡已經(jīng)成為人們出游的必選項。當然,如果不方便出行,也可以通過3D沉浸式體驗“逛”景區(qū)。字節(jié)跳動與火山引擎視頻云聯(lián)合中國第一歷史檔案館、敦煌研究院、甘肅簡牘博物館、國家圖書館(國家典籍博物館)打造了VR《古籍尋游記》項目,依托三維重建技術(shù),我們可以通過Pico、抖音裸眼VR等方式,用戶不僅可以穿越空間,還可以穿越時間,親自“參與”歷史事件。
教育是非常大的市場,除了K12,還有各種興趣培訓、職業(yè)教育、知識傳播等等。權(quán)威投資機構(gòu)報告顯示,素質(zhì)教育、職業(yè)教育等互動直播增長勢頭強勁,知識傳遞的方式也因為視頻化有所突破。今天,不僅學生對線上課堂習以為常,用戶接觸、學習知識的方式也更靈活多樣,刷短視頻快速了解一個知識點,看直播了解投資理財知識,在線學畫畫、刺繡,跟著直播練瑜伽。
疫情加速了在線會議的發(fā)展進程。中國云視頻會議市場從2021年的37億持續(xù)增加到2022年的43億,打破空間限制,極大提升辦公效率,商業(yè)傳遞方式在也發(fā)生改變。疫情雖然過去,但是這種先進的生產(chǎn)方式被固化了下來。
很明顯的一個趨勢是,視頻化呈現(xiàn)出從游戲、電商、社交等消費互聯(lián)網(wǎng),向醫(yī)療、金融、教育、汽車等行業(yè)互聯(lián)網(wǎng)滲透的趨勢,視頻應用轉(zhuǎn)向產(chǎn)業(yè)互聯(lián)網(wǎng)領(lǐng)域,創(chuàng)新出各行各業(yè)場景化的視頻智能應用。
一個新的挑戰(zhàn)擺在企業(yè)面前:如何抓住視頻化的機遇,創(chuàng)新業(yè)務(wù)模式,進行數(shù)智化升級?在超視頻時代業(yè)務(wù)融合、體驗需求、快速創(chuàng)新的趨勢下,視頻云正在成為智能社會的新基建。與視頻快速發(fā)展相匹配的是,近兩年視頻云的技術(shù)在快速迭代,市場規(guī)模也在快速擴張。
「02」
體驗倒逼技術(shù):前臺越豐富,后臺越強大當下,一方面行業(yè)創(chuàng)新應用非常迫切,另一方面用戶的體驗需要不斷提升。千行百行都希望通過快速創(chuàng)新,找到未來突破的方向。
比如,春晚寄托著每一位華人的各種情結(jié),辦好春晚不僅要在節(jié)目上創(chuàng)新,還要在形式上創(chuàng)新。抖音通過網(wǎng)絡(luò)直播春晚,觀看人數(shù)破1.3億,并且每一個人看到的都是高清、絲滑、低延時的內(nèi)容。通過網(wǎng)絡(luò),用戶不僅看,還可以“玩”,搶紅包,聊天,送祝福,邀請好友一起看,在看春晚的同時通過互動增進了親情,也讓喜慶的氛圍更濃郁。
火山引擎視頻云與千行百業(yè)的客戶一起做著類似春晚創(chuàng)新這樣的探索。娛樂場景的多人互動大合唱方案,讓傳統(tǒng)綜藝增加了參與感,煥發(fā)新活力;營銷場景的互動直播,有效的提升了用戶消費轉(zhuǎn)化;虛擬直播間讓品牌和商家可以24小時無休地賣貨,永不關(guān)門的店鋪;VR云制播方案為新品發(fā)布會、賽事直播和文旅直播等行業(yè)帶來了新體驗。
前臺業(yè)務(wù)越豐富,就需要后臺的支撐越強大,體驗倒逼技術(shù)進步。作為智能社會的新基建,視頻云效率提升是依賴全鏈路的技術(shù)提升,包括底層需要芯片、云計算、數(shù)據(jù)庫、人工智能等融合支撐。
為了滿足新需求,火山引擎通過技術(shù)創(chuàng)新努力突破三個邊界:算力邊界,大規(guī)模視頻數(shù)據(jù)與技術(shù)迭代速度不匹配;效能邊界,視頻應用普及與落地接入效率不匹配;融合邊界,行業(yè)深入滲透與場景需求碎片不匹配。
在超視頻時代,企業(yè)端不僅要更快速地創(chuàng)新,并且是跨業(yè)務(wù)、跨平臺融合,在用戶端需要極致的體驗,比如高清、低延時,這都對計算性能和異構(gòu)計算資源的運用提出更多的要求,同時也需要一個能夠應對快節(jié)奏的視頻處理框架,幫助客戶把各種創(chuàng)新快速落地。
面對復雜的需求,火山引擎基于抖音集團大規(guī)模應用實踐和打磨,實現(xiàn)了從通用計算到異構(gòu)計算的躍進,建立起異構(gòu)計算的大底座。
ASIC算力是未來的重點方向,火山引擎在這一次的峰會上帶來了自研視頻編解碼芯片,其一臺芯片服務(wù)器的轉(zhuǎn)碼能力相當于百臺CPU服務(wù)器的算力;同時火山引擎自研視頻編碼芯片的壓縮效率也相當優(yōu)秀,比行業(yè)主流硬件編碼器提升30%+,可以使單個視頻的計算、存儲和傳輸?shù)倪呺H成本達到平衡。這一芯片在視頻直播、超低延時、視頻點播、VR直播/點播、圖片轉(zhuǎn)碼等場景帶來明顯的提升。
FPGA算力相比ASIC密度、吞吐稍差,但是具有可擦寫、更靈活的優(yōu)勢,也是當下算力必不可缺的一部分。火山引擎通過技術(shù)優(yōu)化,F(xiàn)PGA編碼器整體編碼性能比行業(yè)標準編碼器提升了30%。該編碼器也在2023 MSU賽事中獲得最佳4K FPGA編碼器稱號。
首次推出了火山引擎自研ARM陣列服務(wù)器,把編轉(zhuǎn)碼內(nèi)核在ARM指令集上深度集成和優(yōu)化之后,經(jīng)過大規(guī)模實測發(fā)現(xiàn)這種算力資源在密度、成本方面相較x86服務(wù)器有很大優(yōu)勢。
異構(gòu)計算、擴展協(xié)同、復雜場景對框架提出了更為苛刻的要求,基于億級DAU實踐下,火山引擎帶來了通用且易用的下一代視頻處理架構(gòu)BMF。開發(fā)超分模塊,基于原有架構(gòu)大約占用2周的時間,基于BMF,開發(fā)者只需1周即可完成上線。在這個更先進的架構(gòu)上,企業(yè)的互動娛樂場景、直播營銷場景、虛擬直播間等方案都可以更快速地落地。
火山引擎視頻云是在抖音的實踐中成長起來的,隨著千行百業(yè)對視頻需要的增加,火山引擎視頻云將能力向各行各業(yè)輸出。技術(shù)的價值體現(xiàn)在對業(yè)務(wù)的賦能上,為了更好地幫助開發(fā)者、幫助企業(yè)創(chuàng)新,BMF以開源的姿態(tài)示人,用一種普惠的方式加速視頻化的進程。
「03」
AI落地:為視頻創(chuàng)作注入新價值
技術(shù)的終極目的是為了業(yè)務(wù)創(chuàng)新,創(chuàng)造新的業(yè)務(wù)價值,進而提升用戶體驗,所以應用落地是關(guān)鍵。
落地,從場景出發(fā),AIGC是最好的一個注腳。
近日,火山引擎聯(lián)合抖音對100部香港經(jīng)典老電影進行4K修復消息刷爆了朋友圈。一是行業(yè)內(nèi)人士非常興奮,二是每一個熱愛電影的用戶也都非常興奮。賦予老電影二次生命,這就是技術(shù)對藝術(shù)的增值。
今年隨著生成式AI的大火,虛擬主播成為一種流行。國信證券與火山引擎合作了AI虛擬人直播,以吉祥物陽陽為原型,采用火山引擎提供的AIGC技術(shù),圍繞投資者關(guān)心的內(nèi)容自動生成AI短視頻,由3D虛擬人擔任主播進行全天候的投資咨詢和行情解讀服務(wù)。通過AIGC技術(shù),實時讀取行業(yè)板塊、大盤指數(shù)和資訊熱點,結(jié)合自研的數(shù)據(jù)視頻自動渲染合成動畫特效技術(shù),實現(xiàn)直播視頻的自動定時生成內(nèi)容。此外,通過一些預設(shè)的模板,直播間會有數(shù)據(jù)圖表、動畫特效、自動字幕等形式幫助用戶提升觀感。
不僅如此,AIGC還給虛擬主播賦予更多人格,設(shè)計了27款表情和動作,并全方位覆蓋和還原了行情播報場景所需的動作和表情庫。3D虛擬人主播可實現(xiàn)高精度的唇形及表情驅(qū)動,能預測并控制音色的重音、停頓,賦予音色多樣的語氣,演繹出更加真實生動的播報效果。
ChatGPT帶火了大模型,AIGC是最快落地的一個場景。今天,已經(jīng)到了人人都是創(chuàng)作者的時代。不僅每個人都喜歡隨手拍、隨手發(fā),企業(yè)的內(nèi)容創(chuàng)作也大爆發(fā),比如一個車企,不僅有官方的APP內(nèi)容,還有視頻平臺的內(nèi)容,矩陣號,員工號,經(jīng)銷商號,企業(yè)內(nèi)宣,等等。
內(nèi)容無處不在,從拉新、促活、轉(zhuǎn)化的維度為企業(yè)創(chuàng)造著更大的增量。
抖音商家通過精彩的短視頻或是生動的直播實現(xiàn)拉新,汽車之家通過內(nèi)容社區(qū)互動不斷沉淀更多的新用戶;金融行業(yè)數(shù)字人直播通過內(nèi)容促活,激發(fā)業(yè)務(wù)增長;自如通過VR看房提升效率的同時,也大大增加了轉(zhuǎn)化率。
內(nèi)容的爆發(fā),對創(chuàng)作工具有了更高的要求:自動生成內(nèi)容,無需人工剪輯,激發(fā)更多創(chuàng)意,批量生產(chǎn),多個帳號運營……為了幫助企業(yè)高效生產(chǎn)內(nèi)容,火山引擎智能創(chuàng)作云為企業(yè)提供體系化的內(nèi)容生產(chǎn)工具,涵蓋從創(chuàng)意策劃、內(nèi)容制作、內(nèi)容管理、內(nèi)容發(fā)布、數(shù)據(jù)反饋的創(chuàng)作全流程。
今天人們都在討論大模型的時候,火山引擎已經(jīng)逐步讓AI在內(nèi)容生產(chǎn)的全流程落地,AIGC可以實現(xiàn)腳本撰寫、改寫、擴寫,數(shù)字人分身技術(shù)可以讓每一個員工都有一個數(shù)字備份,AI可以快速制作海報,視頻的自動生成,通過文字自動生成圖片,這些AI工具大大地解放了生產(chǎn)力,讓企業(yè)有了更大膽的創(chuàng)新空間。
相信很快,在火山引擎視頻云的支持下,更多的行業(yè)創(chuàng)新將涌現(xiàn)出來。
【結(jié)束語】
譚待表示:“在新基石的技術(shù)演進過程中,我們面臨三大邊界限制:首先,一面是更高清、更交互、更沉浸的視頻體驗成為用戶需求常態(tài),而另一面是技術(shù)突破天花板見頂,導致我們面臨技術(shù)的邊界限制;其次,當視頻化已經(jīng)成為應用標配,一面是快速試錯驗證模式,而另一面是應用接入復雜度高,導致我們面臨效率的邊界限制;最后,隨著視頻化在細分行業(yè)不斷滲透,一方面視頻場景需求碎片,而另一面是行業(yè)方案場景化能力弱,形成行業(yè)融合的邊界限制。”
作為新基石的代表,火山引擎視頻云不斷努力,從底層技術(shù)創(chuàng)新、開放架構(gòu)、場景落地等維度,全方面助力行業(yè)創(chuàng)新,實現(xiàn)科技帶來的增量空間。在視頻把每個行業(yè)重新做一遍的過程中,火山引擎視頻云成為必不可少的一個角色。
關(guān)鍵詞: