2023年顯然是無(wú)可爭(zhēng)議的AI大年,如果對(duì)ChatGPT、OpenAI、生成式AI、LLM(大語(yǔ)言模型)等概念一頭霧水,那你可能就OUT了。甚至自1956年達(dá)特茅斯會(huì)議上人工智能(AI)這一概念誕生以來(lái),AI從未距離大眾如此之近。所以自然而然的,圍繞AI的一切也引發(fā)了大量的關(guān)注,特別是對(duì)于站在浪潮之巔的巨頭們關(guān)于AI的只言片語(yǔ),也總能引發(fā)諸多的熱議。
被稱為“AI教父”的杰弗里·辛頓繼不久前從谷歌離職后,隨即就加入了“AI批評(píng)者”的行列,并大談AI未來(lái)可能會(huì)帶來(lái)的風(fēng)險(xiǎn),甚至還表示,“我對(duì)畢生所研究的東西感到后悔”。
就在他態(tài)度180°大轉(zhuǎn)彎激起、由“不明真相吃瓜群眾”對(duì)AI危險(xiǎn)性的討論尚未落幕之時(shí),一個(gè)據(jù)稱是谷歌高級(jí)軟件工程師Luke Sernau所寫的內(nèi)部信又激起波瀾。而這份被泄露的文件中其實(shí)只有一個(gè)核心主旨,那就是谷歌、OpenAI都沒有護(hù)城河,開源AI將會(huì)摘取這個(gè)賽道最后的勝利果實(shí)。
(相關(guān)資料圖)
在這一場(chǎng)生成式AI的“大戰(zhàn)”中,谷歌顯然只是不折不扣的追趕者。雖然作為阿爾法狗的創(chuàng)造者,多年來(lái)谷歌一直扮演著“AI布道者”的角色,但在生成式AI領(lǐng)域,ChatGPT無(wú)疑才是領(lǐng)路人。緊隨其后的Google Bard公開演示翻車、導(dǎo)致谷歌市值一度蒸發(fā)千億美元后,好不容易推出將生成式AI整合到工作場(chǎng)景的Workspace后,微軟融合了GPT-4的Microsoft 365 Copilot又很快把風(fēng)頭搶走了。
所以在外界看來(lái),如今焦慮一詞或許才是谷歌在面對(duì)生成式AI、LLM時(shí),最為真實(shí)的寫照。
與此同時(shí),領(lǐng)導(dǎo)谷歌前進(jìn)的CEO皮查伊持有保守傾向、并且也受到了不少的掣肘,以至于谷歌的AI路線圖目前并不清晰。在這樣的情況下,公司內(nèi)部的“有識(shí)之士”當(dāng)然也就會(huì)心急如焚。
那么問題就來(lái)了,作為在生成式AI賽道落后的谷歌有危機(jī)感、內(nèi)部傳出悲觀論調(diào)再正常不過,但為什么會(huì)扯上OpenAI呢,或者說(shuō)為什么開源AI才是最終的勝利者?
鮮花著錦烈火烹油,無(wú)疑是當(dāng)下OpenAI的境況。別看這家公司現(xiàn)在幾乎是最炙手可熱的投資標(biāo)的,但據(jù)相關(guān)海外科技媒體在近期曝光的新一輪融資文件顯示,OpenAI的估值來(lái)到了290億美元。可要知道的是,目前在A股,僅僅寒武紀(jì)和昆侖萬(wàn)維這兩家AI概念的市值,就已經(jīng)接近這個(gè)數(shù)字。換而言之,一手點(diǎn)燃了生成式AI這把火的OpenAI,其實(shí)并沒有被投資者給出一個(gè)驚人的估值。
在許多業(yè)內(nèi)人士看來(lái),OpenAI目前的問題在于缺乏一個(gè)清晰的商業(yè)模式,他們現(xiàn)階段唯二可以確定的收入,是一個(gè)月20美元的ChatGPT Plus訂閱服務(wù),以及1k tokens/0.002美元的ChatGPT API,但這兩者顯然還不足以讓OpenAI盈利。甚至有觀點(diǎn)認(rèn)為,OpenAI現(xiàn)在像極了世紀(jì)之交的QQ,盡管同樣都是站在相關(guān)領(lǐng)域的最前沿,但也同樣缺乏一個(gè)明朗的商業(yè)化前景。但后來(lái)QQ等來(lái)了QQ秀,目前OpenAI卻暫時(shí)還看不到解決商業(yè)化難題的契機(jī)。
事實(shí)上,讓谷歌公司的內(nèi)部人士對(duì)谷歌、OpenAI悲觀的核心,是生成式AI、或者說(shuō)LLM本身其實(shí)并沒有太深的護(hù)城河。沒錯(cuò),別看ChatGPT、文心一言這類產(chǎn)品表現(xiàn)得如此智能,但實(shí)際上打造一個(gè)生成式AI并沒有大家想象的那么難。
LLM的理論其實(shí)非常簡(jiǎn)單,即通過分析大量文本數(shù)據(jù)進(jìn)行訓(xùn)練,從而學(xué)習(xí)語(yǔ)言的結(jié)構(gòu)和模式,其所使用的架構(gòu)也是是長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)或門控循環(huán)單元(Gated Recurrent Unit,GRU)等傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。
LLM更像是“力大磚飛”的結(jié)果,然而在ChatGPT一鳴驚人前,業(yè)界更青睞的其實(shí)是谷歌的Transformer模型。而后者追求的卻是如何設(shè)計(jì)出更小、更快,但更準(zhǔn)確的神經(jīng)網(wǎng)絡(luò),甚至于彼時(shí)OpenAI的GPT-3是被業(yè)界作為負(fù)面典型進(jìn)行評(píng)價(jià)的。當(dāng)時(shí)就有業(yè)內(nèi)人士表示,“GPT-3在小樣本學(xué)習(xí)中表現(xiàn)出卓越的能力,但它需要使用數(shù)千個(gè)GPU進(jìn)行數(shù)周的訓(xùn)練,因此很難重新訓(xùn)練或改進(jìn)。”
ChatGPT的成功就成功在它提出了一個(gè)新的思路,畢竟加大參數(shù)、加高算力的大模型也是一個(gè)方向,并且真的讓大模型涌現(xiàn)出了智能。但顯而易見的是,這一模式并沒有護(hù)城河。君不見,即使OpenAI對(duì)自己基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)技術(shù)秘而不宣,也阻攔不了百度文心一言、阿里通義千問、谷歌Bard等等一眾同類大模型的出現(xiàn)。
此前李彥宏就曾在百度的內(nèi)部講話中提到,“算力不能保證我們能夠在通用人工智能技術(shù)上領(lǐng)先,因?yàn)樗懔κ强梢再I來(lái)的,但創(chuàng)新的能力是買不來(lái)的,是需要自建的”,也就是說(shuō)算力和參數(shù)都可以買、技術(shù)壁壘不高。所以也難怪短時(shí)間內(nèi)國(guó)內(nèi)市場(chǎng)的“百模大戰(zhàn)”就已開打,因此先發(fā)優(yōu)勢(shì)在這里幾乎不值一提。
當(dāng)然,如果沒有Meta的LLaMA模型“意外”在4chan上泄露,LLM的技術(shù)壁壘不高也只是相對(duì)大廠而言。但LLaMA模型的被迫開源,也讓開源社區(qū)主導(dǎo)了最近一段時(shí)間針對(duì)ChatGPT的“平替”熱潮。
比如說(shuō)來(lái)自斯坦福的Alpaca,借助Llama的預(yù)訓(xùn)練模型為基礎(chǔ),僅使用來(lái)自GPT模型的一個(gè)小尺寸調(diào)優(yōu)數(shù)據(jù)集(52000個(gè)樣本),就建立了一個(gè)具有對(duì)話功能的LLM。而基于LLaMA模型,以及LoRA (Low-Rank Adaptation of LLM,即插件式的微調(diào))訓(xùn)練,開源社區(qū)在不到兩個(gè)月的時(shí)間里已接連發(fā)布了ChatLLaMa、Alpaca、Vicuna、Koala等模型,并且“羊駝家族”們的實(shí)際效果還直追GPT-3.5、甚至不輸GPT-4。
借助社區(qū)的力量群策群力,并最終實(shí)現(xiàn)極低成本下的高速迭代,這無(wú)疑就是開源AI的優(yōu)勢(shì)。就像谷歌這位員工所說(shuō)的那樣,“如果存在一個(gè)沒有使用限制的免費(fèi)高質(zhì)量替代品,誰(shuí)還會(huì)為帶有使用限制的谷歌產(chǎn)品買單呢?”
因此從某種意義上來(lái)說(shuō),谷歌在Android上的做法可能才是最佳范例,也就是讓開源社區(qū)不自覺地為自己的商業(yè)利益服務(wù)。
所以不得不說(shuō),LLaMA模型泄露更像是一個(gè)神來(lái)之筆,一下子就讓原本掉隊(duì)的Meta實(shí)現(xiàn)了超谷歌、趕OpenAI,畢竟“羊駝家族”就是在Meta的架構(gòu)之上誕生的產(chǎn)物。
責(zé)任編輯:房家輝
分享到:版權(quán)聲明:凡注明來(lái)源“流媒體網(wǎng)”的文章,版權(quán)均屬流媒體網(wǎng)所有,轉(zhuǎn)載需注明出處。非本站出處的文章為轉(zhuǎn)載,觀點(diǎn)供業(yè)內(nèi)參考,不代表本站觀點(diǎn)。文中圖片均來(lái)源于網(wǎng)絡(luò)收集整理,僅供學(xué)習(xí)交流,版權(quán)歸原作者所有。如涉及侵權(quán),請(qǐng)及時(shí)聯(lián)系我們刪除!關(guān)鍵詞: