《生成式人工智能服務(wù)管理暫行辦法》近日正式施行。生成式人工智能作為在文本、圖片、音頻、視頻等內(nèi)容生成領(lǐng)域最先進的技術(shù),該管理辦法的出臺將對廣播電視和網(wǎng)絡(luò)視聽產(chǎn)生深遠(yuǎn)影響。本文簡要梳理了當(dāng)前行業(yè)中采用生成式人工智能(AIGC)的部分案例,探討AIGC技術(shù)在音視頻內(nèi)容生產(chǎn)、影視創(chuàng)作、虛擬主播、內(nèi)容審核、智能推薦等領(lǐng)域的潛在發(fā)展趨勢。
在這支AI制作的科幻電影預(yù)告片《Trailer: Genesis》(《創(chuàng)世紀(jì)》)中,從圖像視頻合成、音樂到剪輯均由AI完成,使用的AI工具及用途包括了Midjourney 處理圖像、Runway 處理視頻、Pixabay 處理音樂、CapCut 剪輯視頻等。
(相關(guān)資料圖)
AIGC+音視頻生成:
提高內(nèi)容生產(chǎn)者創(chuàng)作效率
音視頻生成技術(shù)在語音合成、智能音樂創(chuàng)作、自動化視頻集錦、視頻拆條、視頻超分、游戲開發(fā)和虛擬現(xiàn)實等細(xì)分場景中擁有廣泛的應(yīng)用前景,且高效節(jié)省了人力時間成本。
2020年全國兩會期間,人民日報社利用“智能云剪輯師”實現(xiàn)自動匹配字幕、人物實時追蹤、畫面抖動修復(fù)、橫屏速轉(zhuǎn)豎屏等技術(shù)操作,快速生成視頻以適應(yīng)多平臺分發(fā)要求。
2022年冬奧會期間,科大訊飛的智能錄音筆通過跨語種語音轉(zhuǎn)寫2分鐘快速出稿,央視利用AI智能內(nèi)容生產(chǎn)剪輯系統(tǒng)制作與發(fā)布冬奧會冰雪項目的視頻集錦,極大地提高了制作效率,縮短發(fā)布周期。
整體來看,視頻生成技術(shù)主要是通過大量學(xué)習(xí)視頻中的空間、序列、時間、場景、物體和動作等信息,自動生成具備真實感和更加多樣化的視頻內(nèi)容。同時,根據(jù)給定的輸入條件,并通過視頻去噪、色彩校正、邊緣增強等后期處理,在保持視頻逼真度的同時實現(xiàn)對生成視頻的精細(xì)化控制和細(xì)節(jié)的修復(fù)與優(yōu)化。
音頻生成主要是利用深度神經(jīng)網(wǎng)絡(luò)模型對大量音頻數(shù)據(jù)進行訓(xùn)練學(xué)習(xí),自動生成高質(zhì)量、逼真的多種音頻類型,還可以根據(jù)特定場景或需求對生成的音頻進行優(yōu)化和定制,以滿足不同用戶的需求。
AIGC+虛擬主播:
推動虛實融合多樣化進程
近幾年越來越多的虛擬主播正走向前臺,如總臺的“小小撒”和“AI王冠”,北京臺的“時間小妮”、湖南臺的“小漾”、東方衛(wèi)視的“申雅”“東方嬡”、浙江衛(wèi)視的“谷小雨”等等。這些虛擬主播好看的皮囊下,離不開AIGC技術(shù)的賦能。通過深度學(xué)習(xí)算法分析和學(xué)習(xí)大量人類主播的視頻和音頻數(shù)據(jù),AIGC生成具有逼真、自然的語音和動作的虛擬主播。這些虛擬主播可以隨時隨地出現(xiàn)在直播、電視節(jié)目等各種形態(tài)中,極大地豐富了數(shù)字內(nèi)容的形態(tài)和表現(xiàn)方式,為廣播電視和網(wǎng)絡(luò)視頻領(lǐng)域注入更多的創(chuàng)意和活力。
多家媒體正在積極布局AI虛擬主播,并將其應(yīng)用場景從新聞播報擴展至晚會主持、記者報道、天氣預(yù)報等更廣泛場景,為全國兩會、冬奧會、冬殘奧會等重大活動深度賦能。
如北京臺的“時間小妮”經(jīng)過情緒仿真引擎處理,其外貌、語音、口型、肢體動作與真人相似度達到97%,可用于營銷宣傳、新聞報道、教育教學(xué)、智能問答等多個領(lǐng)域。2022年兩會期間,百度利用AIGC技術(shù)生成虛擬數(shù)字人主播“度曉曉”,通過多模態(tài)交互技術(shù)、3D數(shù)字人建模、機器翻譯、語音識別、自然語言理解等技術(shù),能夠快速、準(zhǔn)確地播報新聞內(nèi)容,且具有自主學(xué)習(xí)能力。
AIGC+影視創(chuàng)作:
賦能高效內(nèi)容生產(chǎn)
在劇本創(chuàng)作和故事生成階段,AIGC主要運用其文本生成功能,生成具有一定參考價值的劇本段落甚至完整劇本,特別是在情節(jié)演進和角色對話生成方面為創(chuàng)作者提供一定便利。越來越多的AI編寫劇本產(chǎn)品已經(jīng)出現(xiàn)在市場中,如2020年美國學(xué)生用OpenAI的大模型GPT-3創(chuàng)作劇本并制作的短片《律師》。目前,搭畫快寫AI、觸站AI、輕微課AI等已經(jīng)成為編劇領(lǐng)域具有一定代表性的AI輔助創(chuàng)作產(chǎn)品。
在內(nèi)容創(chuàng)作階段,AIGC可以完成從劇本到分鏡的自動拆解與生成,從而縮短劇集的籌備周期。到畫面生成階段,AIGC可以根據(jù)數(shù)據(jù)和大量訓(xùn)練,依據(jù)給定的文本描述、圖片和視頻等智能地生成包括角色動作、場景布置和特效效果等的畫面。目前Meta AI發(fā)布了文本生成視頻的AI系統(tǒng)“Make-A-Video”,Google發(fā)布了Imagen Video和Phenaki。
Netflix公開了一部由AI參與制作的動畫片《犬與少年》(The Dog and The Boy),時長3分鐘,由Netflix日本、小冰公司日本分部(rinna)和WIT STUDIO共同創(chuàng)作。這是第一部AIGC技術(shù)輔助制作的發(fā)行級商業(yè)動畫片,其所有動畫場景繪制均由AI生成。在影片結(jié)尾,制作團隊展示了AI輔助場景制作的大致過程,可以分為四步:布局、AI生成及進一步生成、成稿。
AIGC+內(nèi)容審核:
助力審核高效化發(fā)展
AIGC技術(shù)在視聽內(nèi)容審核方面發(fā)揮著重要作用。例如,通過語音識別和語義理解技術(shù),AIGC技術(shù)可以檢測和識別內(nèi)容中的敏感詞匯和暴力內(nèi)容,從而對違規(guī)內(nèi)容進行標(biāo)記和刪除。此外,AIGC技術(shù)還能夠通過圖像和視頻分析技術(shù)監(jiān)測、識別和過濾如色情和暴力畫面等不良內(nèi)容。
騰訊與虎牙共同成立的AI智能審核平臺中,虎牙結(jié)合自研“AI智能識別、人工審核和網(wǎng)絡(luò)志愿者”三位一體模式,騰訊則全面開放“AI+大數(shù)據(jù)”內(nèi)容風(fēng)控安全技術(shù),共同優(yōu)化內(nèi)容識別能力,以應(yīng)對直播平臺內(nèi)容風(fēng)險和威脅,營造更為安全的內(nèi)容生產(chǎn)環(huán)境。
百度提出“AI內(nèi)容風(fēng)控”概念,通過應(yīng)用圖像識別、富媒體識別、NLP、分類/聚類、關(guān)聯(lián)挖掘、機器學(xué)習(xí)等技術(shù),對違法違規(guī)、垃圾信息、內(nèi)容質(zhì)量差等情況進行風(fēng)控,可實現(xiàn)對多種內(nèi)容的跨場景判斷,據(jù)稱99%的信息在上線前能被自動攔截,減少了大量人工勞動。
然而,AIGC技術(shù)仍然無法完全替代人類審查,可能會漏檢或誤判某些內(nèi)容。比如難以識別復(fù)雜的隱喻、諷刺等語言形式,難以理解某些具有特殊含義的圖片、視頻等內(nèi)容。因此,在實際應(yīng)用中,需要結(jié)合人工審核來提高審核的準(zhǔn)確性和可信度。
AIGC+智能推薦:
完善用戶個性化體驗
隨著用戶需求的日益?zhèn)€性化和多樣化,在內(nèi)容智能推薦領(lǐng)域,AIGC技術(shù)同樣蘊藏了諸多可能性。比如,通過對用戶的觀看行為、視頻偏好等數(shù)據(jù)進行分析,AIGC能建立完整的用戶畫像,智能推薦符合用戶興趣的音視頻內(nèi)容,還可以生成個性化的新聞播報、廣告宣傳等音視頻內(nèi)容。
目前,央視視頻、芒果TV、騰訊視頻、愛奇藝、優(yōu)酷、今日頭條等平臺均結(jié)合AIGC技術(shù)分析用戶行為和興趣偏好,分析用戶觀看歷史、搜索記錄、點贊、評論等細(xì)粒度數(shù)據(jù),為用戶提供針對性更強、內(nèi)容更加精準(zhǔn)的視頻推薦。這不但能促進視頻內(nèi)容的多樣化、個性化,還有助于增強廣播電視和網(wǎng)絡(luò)視聽領(lǐng)域的用戶黏性和平臺競爭力。
未來,隨著數(shù)據(jù)規(guī)??焖倥蛎洝⑺懔π阅懿粩嗵嵘约叭斯ぶ悄芩惴ú粩喟l(fā)展,AIGC能夠替代內(nèi)容創(chuàng)作者完成更多內(nèi)容挖掘、素材查詢調(diào)用等基礎(chǔ)性勞動,在視音頻制作、內(nèi)容審核、個性推薦等方面發(fā)揮更大作用。同時,也需要全行業(yè)加強多維互動合作、共同研究,推動制定相關(guān)的規(guī)范、標(biāo)準(zhǔn)和政策,以保證AIGC技術(shù)在視聽領(lǐng)域的合法合規(guī)合理使用與可持續(xù)發(fā)展。
(國家廣電總局發(fā)展研究中心彭錦、曹思和據(jù)公開資料整理)
推薦閱讀:
國家網(wǎng)信辦等七部門聯(lián)合公布《生成式人工智能服務(wù)管理暫行辦法》
第26屆論道啟動!11月相聚春城昆明,共尋智能視聽新增長。點擊圖片報名參會~
責(zé)任編輯:李楠
分享到:版權(quán)聲明:凡注明來源“流媒體網(wǎng)”的文章,版權(quán)均屬流媒體網(wǎng)所有,轉(zhuǎn)載需注明出處。非本站出處的文章為轉(zhuǎn)載,觀點供業(yè)內(nèi)參考,不代表本站觀點。文中圖片均來源于網(wǎng)絡(luò)收集整理,僅供學(xué)習(xí)交流,版權(quán)歸原作者所有。如涉及侵權(quán),請及時聯(lián)系我們刪除!關(guān)鍵詞: