(原標(biāo)題:中國最接近GPT3.5的團(tuán)隊(duì),默默無聞的駐扎在西湖邊)
(資料圖片僅供參考)
作者|舉大名耳
導(dǎo)語:過往的產(chǎn)品打造已經(jīng)驗(yàn)證了西湖心辰的商業(yè)潛力,與 OpenAI 相似的人才與理念,也讓其在打造中國版GPT的道路上,具備了更加堅(jiān)實(shí)的基礎(chǔ)。
上月月底,完成百度風(fēng)投領(lǐng)投的Pre-A輪融資后,西湖心辰(杭州)科技有限公司(以下簡稱“西湖心辰”)近日再獲湯姆貓(300459.SZ)戰(zhàn)略投資。
產(chǎn)品全球用戶基數(shù)龐大,月活躍用戶超4億的湯姆貓,之所以會(huì)選中西湖心辰,是因?yàn)榭粗辛似漕I(lǐng)先國內(nèi)的大模型研發(fā)水準(zhǔn)及其有長期記憶、情感感知和主動(dòng)聊天的特色。
憑借著頂流的技術(shù)團(tuán)隊(duì)、多模態(tài)的技術(shù)優(yōu)勢(shì),這個(gè)默默無聞的低調(diào)企業(yè),不僅打造了國內(nèi)極少數(shù)能與GPT-3.5一較高下的大模型,還多次贏得了360周鴻祎、美團(tuán)王慧文的青睞。
如今,湯姆貓將成為西湖心辰團(tuán)隊(duì)外的最大外部股東,憑籍本次投資,雙方將在多模態(tài)大模型、通用人工智能垂直領(lǐng)域模型及終端硬件等交互產(chǎn)品領(lǐng)域開展深度合作并快速落地。
將“會(huì)說話的湯姆貓”升級(jí)迭代成有記憶、有情感、能主動(dòng)聊天的湯姆貓,將應(yīng)用場(chǎng)景從游戲拓展到教育、智能硬件、智能家居入口。 低調(diào)的頂流團(tuán)隊(duì)雖然在目前這場(chǎng)追逐GPT的熱潮中,不少企業(yè)都立下了趕超 OpenAI、打造「中國版 ChatGPT」的豪言壯志,其中就包括了「西湖心辰」這家創(chuàng)立時(shí)間不到兩年的公司。
那么,為何這家如此年輕的企業(yè),敢夸下這樣的海口?
最重要的原因,恐怕就在于,這支低調(diào)的團(tuán)隊(duì),擁有國內(nèi)幾乎最頂尖的研究力量
西湖心辰的創(chuàng)始人藍(lán)振忠,不僅身為卡內(nèi)基梅隆大學(xué)(CMU)的人工智能博士,還在Google人工智能研究院擔(dān)任科學(xué)家期間,主導(dǎo)研發(fā)了谷歌大模型BERT的輕量化版本:ALBERT(學(xué)術(shù)引用4600+),大模型領(lǐng)域頗有影響力。
目前,藍(lán)振忠的相關(guān)研究已應(yīng)用在Google News和Google Assistant等覆蓋數(shù)億用戶的產(chǎn)品中,同時(shí),藍(lán)振忠還是國內(nèi)目前極少數(shù)有實(shí)際使用數(shù)千張GPU訓(xùn)練出大模型經(jīng)驗(yàn)的科研工作者之一。
「西湖心辰」團(tuán)隊(duì)的核心成員,既有來自Google、Meta、Amazon等公司的高管和科研專家,覆蓋了大模型的架構(gòu)、訓(xùn)練、推理等關(guān)鍵環(huán)節(jié)。也有在應(yīng)用層面深耕人與AI交互、自然語言處理,并頗具技術(shù)經(jīng)驗(yàn)的實(shí)干型人才。
可謂建立了一套從理論到應(yīng)用層面的完整人才體系。
這支高人才密度的團(tuán)隊(duì),為西湖心辰帶來了深厚的技術(shù)實(shí)力和前瞻性。
更重要的是,西湖心辰背靠中國新型研究型大學(xué)西湖大學(xué),擁有豐厚的人才儲(chǔ)備和強(qiáng)大的算力資源,此前,西湖大學(xué)就曾利用大規(guī)模 AI 集群成功解析新冠病毒的受體—— ACE2 的全長結(jié)構(gòu),此成果登上 Science 封面,推動(dòng)了抗疫藥物的研發(fā)。
如此雄厚的技術(shù)實(shí)力,無疑為西湖心辰打造“中國版 ChatGPT”的道路奠定了基礎(chǔ)。
匯聚了國內(nèi)頂尖AI人才的西湖心辰,專注于大模型的研究和應(yīng)用,秉承提升通用大模型能力,推進(jìn)上層應(yīng)用智能化的認(rèn)知理念,構(gòu)建了模型層—中間層—應(yīng)用層的產(chǎn)品架構(gòu)。
憑借著過硬的技術(shù)積累,他們?cè)诖竽P偷难芯亢蜕虡I(yè)化落地方面,領(lǐng)先國內(nèi)其他創(chuàng)業(yè)團(tuán)隊(duì)一年,已經(jīng)積累了超過百萬的用戶,并且在模型層,訓(xùn)練出了匹敵GPT3.5 千億級(jí)參數(shù)的語言大模型RIO。
按照模型參數(shù)量大小,RIO系列現(xiàn)在已有十幾個(gè)成員,參數(shù)量從100多億到1000多億不等,支持中英文雙語,除了記憶外,還掌握了搜索引擎、知識(shí)圖譜、外部數(shù)據(jù)等認(rèn)知工具調(diào)用能力。
通過一個(gè)收集的用戶如何用大模型的通用題庫(該方法與GPT3.5的評(píng)估方式相似),西湖心辰把RIO模型與GPT3.5做了比較,發(fā)現(xiàn)130億參數(shù)的RIO模型可以達(dá)到類似于GPT3.5的效果,即標(biāo)注者無法分辨出哪一個(gè)更好一些。
當(dāng)通用模型預(yù)訓(xùn)練完備后,垂直領(lǐng)域的高質(zhì)量數(shù)據(jù)是持續(xù)迭代的基礎(chǔ)——在獲得數(shù)據(jù)之后,調(diào)優(yōu)功能會(huì)讓模型更智能。
目前,RIO大模型在處理非結(jié)構(gòu)化數(shù)據(jù)的能力上有了極大提升,過往在企業(yè)內(nèi)部沉淀下來卻未被充分利用的數(shù)據(jù),將在大模型賦能下展示出更多價(jià)值。
在這一產(chǎn)品架構(gòu)下,終端應(yīng)用和底層大模型的聯(lián)動(dòng)十分緊密。
藍(lán)振忠表示,西湖心辰推出應(yīng)用時(shí),會(huì)依據(jù)應(yīng)用的難度和需要推理的速度選擇合適的模型,再通過該應(yīng)用相關(guān)領(lǐng)域的數(shù)據(jù)進(jìn)行調(diào)優(yōu)。模型的能力也會(huì)直接影響的整體效果。
在大模型數(shù)據(jù)質(zhì)量日益提升的情況下,各種基于應(yīng)用層面的具體產(chǎn)品,也就應(yīng)運(yùn)而生了。
多模態(tài)的試水在應(yīng)用層面,西湖心辰目前圍繞著心理、繪畫和寫作方面,推出了三款產(chǎn)品,并已積累了數(shù)百萬用戶。
它們分別是:
心理咨詢小程序——聊會(huì)小天。 AI寫作小程序——Friday快寫寶。 AI繪畫小程序——造夢(mèng)日記。 1.聊會(huì)小天2020年,剛回國發(fā)展的藍(lán)振忠,遇到了突如其來的疫情,面對(duì)疫情造成的不安、焦慮,藍(lán)振忠意識(shí)到,AI在解決社會(huì)心理需求方面,也能發(fā)揮重要作用。
于是,藍(lán)振忠迅速組建了一支科研隊(duì)伍,著手研發(fā)AI心理咨詢平臺(tái),想要打造一個(gè)更普惠、智能且專業(yè)的AI心理咨詢平臺(tái)。
目前,AI心理咨詢平臺(tái)小天,已經(jīng)和多個(gè)醫(yī)院開展合作,接訪了來自全國各地的咨詢者近2萬人,并通過獲取的真實(shí)的、高質(zhì)量的數(shù)據(jù)集,加速產(chǎn)品迭代,為用戶提供深度情感陪伴。
2.Friday快寫寶
憑借著自主研發(fā)的創(chuàng)新性AI算法和對(duì)Google搜索引擎偏好的了解,F(xiàn)ridayAI開發(fā)了60多種不同的寫作模板,以及100多種可定制的寫作場(chǎng)景。
選擇模板后,只需要輸入關(guān)鍵詞,就能有針對(duì)性地生成獨(dú)特、原創(chuàng)且高質(zhì)量的文案。
憑借著強(qiáng)大的文本生成技術(shù)、AI編輯能力,F(xiàn)riday快寫寶能滿足電商、新媒體、短視頻等多個(gè)領(lǐng)域,多種文風(fēng)的不同文案。
從而極大地提升了企業(yè)的出稿效率。
3.造夢(mèng)日記
西湖心辰在2022年8月推出的AI畫圖產(chǎn)品“盜夢(mèng)師”(現(xiàn)已改為“造夢(mèng)日記”), 目前積累了超過百萬 C 端用戶,數(shù)十家 B 端用戶。
經(jīng)測(cè)試,造夢(mèng)日記生成的AI繪畫速度僅在3秒之內(nèi),而市面上其他平臺(tái)的出圖速度則在幾十秒甚至一兩分鐘左右。
這樣的快速反映也是得益于西湖心辰在AI領(lǐng)域多年的技術(shù),以及西湖大學(xué)實(shí)驗(yàn)室的成熟算力。
除了出色的生成速度,造夢(mèng)日記也針對(duì)諸如漫畫、內(nèi)容營銷等專業(yè)用戶開發(fā)了會(huì)員版,涵蓋了豐富的專屬模型,也可以自定義自己的畫風(fēng),從而滿足了多樣化的繪畫需求。
在地上拽著AI的風(fēng)箏如果說,OpenAI的成功,讓ChatGPT成為了引爆AGI(人工通用智能)萬里征程的第一個(gè)爆點(diǎn),那么接下來最有可能的爆點(diǎn),就是AGI沿途所涉及的各種應(yīng)用。
因?yàn)樵傧冗M(jìn)的模型,再出色的算法,終歸還是要滿足社會(huì)的真實(shí)需求,才能真正生根發(fā)芽。
而西湖心辰創(chuàng)始人藍(lán)振忠,以突出的國內(nèi)外學(xué)術(shù)與產(chǎn)業(yè)融合的積累,賦予了西湖心辰立足多模態(tài)大模型,穿透模型層、中間層以及應(yīng)用層的布局戰(zhàn)略。
雖然語言大模型的投入更大,但當(dāng)用戶足夠多,數(shù)十億的成本平攤下來,幾乎可以忽略不計(jì),跟高速的建設(shè)是一個(gè)邏輯。
而對(duì)于寫作、繪畫這類各行業(yè)都有著巨大需求的“泛用”技能,西湖心辰則下足了領(lǐng)域細(xì)分的功夫,滿足了多業(yè)態(tài),多層次群體的需求。
如文本生成的應(yīng)用場(chǎng)景覆蓋營銷文案寫作、郵件寫作、辦公寫作、論文寫作、短消息回復(fù)等等用途,不僅更專業(yè),也更“體貼”。
而其推出的AI繪畫工具,也最大程度地兼顧了普通、專業(yè)、B 端、甚至小 B 端群體的使用需求。
過往的產(chǎn)品打造已經(jīng)驗(yàn)證了西湖心辰的商業(yè)潛力,而與 OpenAI 相似的人才與理念,也讓其在打造中國版GPT的道路上,具備了更加堅(jiān)實(shí)的基礎(chǔ)。
正如Sam Altman 不一味堅(jiān)持技術(shù)理想主義,引入微軟,平衡了技術(shù)發(fā)展的需求與商業(yè)轉(zhuǎn)化的目標(biāo),并最終成就了ChatGPT一樣,
當(dāng)前中國AGI的發(fā)展,也需要像西湖心辰這樣,在地上緊緊拽著人工智能這個(gè)風(fēng)箏,將之與世間各種需求緊密相連的企業(yè)。
關(guān)鍵詞: