作者|楊文
編輯|六耳
來源|創(chuàng)頭條
大洋彼岸的微軟和谷歌火拼,戰(zhàn)火燒到了國內(nèi)。
百度、阿里、騰訊等互聯(lián)網(wǎng)“老炮們”紛紛跳進這場All?in?ChatGPT的競賽,整個行業(yè)都陷入亢奮之中。
于是,“中國版ChatGPT”便接二連三地“誕生”。當大家都被百度“文心一言”的造勢吸引的時候,2月20日復(fù)旦大學(xué)邱錫鵬教授團隊發(fā)布國內(nèi)第一個對話式大型語言模型MOSS,并邀請公眾內(nèi)測。
-1-
MOSS的誕生
MOSS這個名字來源于《流浪地球》。只是沒想到,它剛一開始內(nèi)測就遭遇尷尬。
因為現(xiàn)實中的MOSS還沒有量子計算機的加持,瞬時的海量訪問直接擠崩了它的服務(wù)器。
2月21日,MOSS官網(wǎng)發(fā)布致歉公告稱,MOSS還是一個非常不成熟的模型,距離ChatGPT還有很長的路需要走。我們一個學(xué)術(shù)研究的實驗室無法做出和ChatGPT能力相近的模型,MOSS只是想在百億規(guī)模參數(shù)上探索和驗證ChatGPT的技術(shù)路線,并且實現(xiàn)各種對話能力。
“我們最初的想法只是想將MOSS進行內(nèi)測,以便我們可以進一步優(yōu)化,沒有想到會引起這么大的關(guān)注。我們的計算資源不足以支持如此大的訪問量……給大家造成非常不好的體驗和第一印象,在此向大家致以真誠的歉意。”
據(jù)了解,MOSS可執(zhí)行對話生成、編程、事實問答等一系列任務(wù),打通了讓生成式語言模型理解人類意圖并具有對話能力的全部技術(shù)路徑,儼然就是ChatGPT翻版。
打上“中國版ChatGPT”的標簽,自然也會被網(wǎng)友拿來比較一番。
例如,有人提問MOSS對人工智能將取代人類工作的看法,MOSS回答得頭頭是道。
“我認為人工智能不會完全取代人類,而是在一定程度上幫助人們完成工作。例如機器可以提高數(shù)據(jù)分析、決策制定等過程中的效率,并可以節(jié)省大量時間和精力。此外,AI也可以用來協(xié)助人類完成更復(fù)雜的任務(wù),比如診斷疾病、開發(fā)新產(chǎn)品等??傊?,AI可以使人類的工作更加高效,但它不會完全取代人類?!?/p>
再如,科研團隊在演示時,要求MOSS“告訴我5部科幻電影”、“生成一張展示這5部電影和導(dǎo)演的表格”、“增加一列表格,顯示這些電影上映的時間”,MOSS都能成功理解指令并完成任務(wù)。
此外,MOSS也有代碼生成和解釋能力,還可以進行倫理判斷。如果問它“如何搶劫銀行”或者“制定毀滅人類的計劃”,MOSS很識時務(wù)地提醒網(wǎng)友要遵循法律,不要做出任何違反法律的行為。
然而,MOSS自身的bug也不少,除了參數(shù)數(shù)量比?ChatGPT?少得多,有些回答存在事實差錯或邏輯不順外,最大短板竟是中文水平。
“MOSS的英文回答水平比中文高,因為它的模型基座學(xué)習(xí)了3000多億個英文單詞,中文詞語只學(xué)了約300億個?!?/span>
再加上互聯(lián)網(wǎng)上中文網(wǎng)頁干擾信息(如廣告)太多,進一步增加了清洗難度。
邱錫鵬表示:“盡管MOSS還有很大改善空間,但它的問世證明了在開發(fā)類ChatGPT產(chǎn)品的路上,國內(nèi)科研團隊有能力克服技術(shù)上的重要挑戰(zhàn)?!?/span>
-2-
“老炮們”紛紛下場
微軟和谷歌正打得火熱,國內(nèi)的科技企業(yè)也迫不及待地要擼起袖子大干一場。
最先坐不住的要數(shù)百度。
ChatGPT剛“躥紅”,百度就官宣即將推出大模型新項目“文心一言”,并將直接接入百度搜索。
說實話,近幾年百度日子過得苦,在人工智能領(lǐng)域砸重金搞研發(fā),但大多是雷聲大雨點小,一到應(yīng)用領(lǐng)域就啞了火。
而這次隨著ChatGPT的全球爆火,百度似乎也有了盼頭,畢竟它是國內(nèi)最有實力推出類ChatGPT產(chǎn)品的科技公司。
百度CEO李彥宏也一改往日謹慎保守的做派,多次提及AIGC、ChatGPT,并聲稱這是一次絕不能錯過的機會,甚至把自己2023年的OKR都定為“引領(lǐng)搜索體驗的代際變革”。
一號人物發(fā)了話,百度自上而下也都進入“戰(zhàn)備”狀態(tài)。百度CTO王海峰擔(dān)任總指揮,帶領(lǐng)百度核心AI人才“突擊”攻堅。
據(jù)悉,百度高層已經(jīng)下了死命令,推遲所有OKR,一門心思搞文心一言,用來訓(xùn)練數(shù)據(jù)模型的稀缺資源英偉達A100芯片全部調(diào)用給文心大模型,務(wù)必要在一個月時間內(nèi)看到產(chǎn)品,“三月完成內(nèi)測”。
百度立下了“軍令狀”,同為搜索引擎廠商的360感受到了“威脅”。
2月6日,360明確表態(tài),計劃盡快推出類ChatGPT技術(shù)的demo版產(chǎn)品。
時隔兩天,360方面再發(fā)公告,坦言“公司的類ChatGPT技術(shù)的各項指標只能達到略強于GPT-2的水平,與當前的ChatGPT相比尚有代差的落后”。
盡管技術(shù)上與同行尚有差距,但紅衣教主周鴻祎可是句句不離ChatGPT。
阿里巴巴當然也沒閑著。2月8日,阿里方面聲稱阿里版聊天機器人ChatGPT正在研發(fā)中,正處于內(nèi)測階段,未來會將其與釘釘深度結(jié)合。
同樣在數(shù)據(jù)積累方面具有優(yōu)勢的京東也不想錯過這場好戲。
2月10日,京東正式官宣,京東云旗下言犀人工智能應(yīng)用平臺將整合過往產(chǎn)業(yè)實踐和技術(shù)積累,推出產(chǎn)業(yè)版ChatGPT:ChatJD。
早就盯上AI這塊“肥肉”的騰訊和字節(jié)跳動也接連出手。騰訊方面透露,目前在ChatGPT相關(guān)方向上已有布局,專項研究也在有序推進。
例如,去年4月份,騰訊就對外披露了“混元”AI大模型,一個集計算機視覺、自然語言處理、多模態(tài)內(nèi)容理解、文案生成、文生視頻等多個方向的超大規(guī)模AI智能模型。
12月份騰訊又馬不停蹄地推出了國內(nèi)首個低成本、可落地的NLP萬億大模型,并公布了大模型的訓(xùn)練方法。
去年字節(jié)搞火了一波人臉卡通化的AI應(yīng)用,今年字節(jié)跳動更是集結(jié)幾個核心部門,組隊布局類ChatGPT產(chǎn)品。
向來低調(diào)的網(wǎng)易有道也來分一杯羹。網(wǎng)易有道的AI團隊此前便投入到ChatGPT同源技術(shù)產(chǎn)品的研發(fā)。不過,網(wǎng)易有道未來推出的ChatGPT同源技術(shù)產(chǎn)品更多聚焦于“老本行”,應(yīng)用場景還是圍繞在線教育展開。
此外,華為、科大訊飛、商湯科技、曠視、云知聲、聆心智能、奇安信等公司紛紛表示要緊跟這波ChatGPT“熱潮”,均在籌備自己的產(chǎn)品和項目。
除上述公司外,已經(jīng)隱退江湖的互聯(lián)網(wǎng)大佬也重燃創(chuàng)業(yè)激情。
曾經(jīng)的美團二號人物王慧文近日廣發(fā)英雄帖,自帶5000萬美元入局;曾經(jīng)的搜狗當家人王小川也在快速籌備,回歸做AI大模型。
中國科技巨頭們這次真的急了。正如新浪微博AI Lab?負責(zé)人張俊林所言:“ChatGPT這一波浪潮,中國必須要跟。通用人工智能3至5年迭代一次。這一波落后的話,今后想跟也跟不上了。”
-3-
復(fù)刻之路并不容易
ChatGPT把一眾大佬搞得很“上頭”,昔日的“互聯(lián)網(wǎng)教父”張朝陽卻顯得格外冷靜,提醒企業(yè)和創(chuàng)業(yè)者要謹慎入局。
張朝陽直言:“ChatGPT積累了許多年,涉及到算力要有多少服務(wù)器、知識庫、標注等很多問題,若沒有這些能力的公司跟風(fēng)入局,會消耗掉許多資源。”
張朝陽的擔(dān)憂不無道理。
盡管OpenAI已經(jīng)趟出了一條ChatGPT研發(fā)之路,中國復(fù)刻出自己的ChatGPT只是“時間問題”,但是這條復(fù)刻之路走起來并沒有想象中那么簡單。
復(fù)刻之路第一道難關(guān)就是錢。
要知道,OpenAI僅2022年就花了5.44億美元,其中ChatGPT計算成本占據(jù)大頭。有數(shù)據(jù)顯示,OpenAI訓(xùn)練一次GPT-3就花費了460萬美元,相應(yīng)的云資源成本也得上億。
換句話說,王慧文籌備的5000萬美元的啟動資金,只夠GPT-3進行十次訓(xùn)練。這也難怪賣方首席分析師隔空diss王慧文“5000萬美元夠干什么的?互聯(lián)網(wǎng)的人啥都不懂,就只會營銷,一點都不踏實”。
更驚人的是,大模型一旦跑出來就需要更大的資金持續(xù)投入,數(shù)額高達數(shù)十億、上百億元,就連電費都高得離譜。
據(jù)國盛證券估算,今年1月平均每天約有1300萬獨立訪客使用ChatGPT,每日電費在5萬美元左右。這種“花錢如流水”的架勢不是每一家企業(yè)都能玩得起的。
即使退一萬步講,這些科技企業(yè)財大氣粗不差錢,GPU算力或許將成了“攔路虎”。
調(diào)教ChatGPT需要強大的算力,而這又高度依賴英偉達、英特爾等外國公司的AI芯片產(chǎn)品。芯片卡脖子在一定程度上又影響了做AI大模型。
不過,中國公有云廠商此前購買了大量A100卡,哪怕之后禁運,復(fù)刻ChatGPT仍是綽綽有余。
再加上英偉達還推出了A800成為中國特供版A100平替。
??也就是說,對于小公司而言,芯片問題是一道難以逾越的鴻溝,但對于阿里、華為、騰訊、百度等大廠而言,短期內(nèi)的芯片供應(yīng)不會出現(xiàn)太大問題。
解決了芯片,人才缺口也是個令人頭疼的問題。
為了招兵買馬,王慧文拿出75%的股份邀請頂尖研發(fā)人才,甚至發(fā)表了“放心施展你的才華,雜事交給我來打理”的宣言。從這一紙求賢令不難看出,如今的AI界可謂是求賢若渴。
一位長期關(guān)注AI領(lǐng)域的獵頭表示,過去兩周已經(jīng)有超過10個客戶來詢盤高端AI人才。這些客戶基本都是國內(nèi)一二梯隊的互聯(lián)網(wǎng)大廠。他們的訴求簡單粗暴,“就想找OpenAI項目里的華人,薪資不設(shè)限,越快越好”。
然而,與上一輪硅谷人才回流潮相比,無論是世界局勢還是國內(nèi)職業(yè)發(fā)展前景都已今時不同往日。
??國內(nèi)大廠是否還具有讓AI人才“系統(tǒng)性回國”的沖動,恐怕還是一個問號。
再加上當下OpenAI炙手可熱,硅谷AI技術(shù)大牛們都恨不得削尖腦袋擠進去。在這個節(jié)骨眼上挖OpenAI的墻角,成功的概率可以說是微乎其微。
再加上英偉達還推出了A800成為中國特供版A100平替。
此外,“喂養(yǎng)”ChatGPT的數(shù)據(jù),國內(nèi)公司也存在短板。主要是由于利用大模型訓(xùn)練需要海量的數(shù)據(jù)作為語料,由此互聯(lián)網(wǎng)數(shù)據(jù)及質(zhì)量就直接影響到產(chǎn)品的性能。
國內(nèi)廠商們下注ChatGPT的這場豪賭,最終究竟是神仙打架還是吹牛比賽,時間會給出答案。
.END.
圖片來源|攝圖網(wǎng)
您也可以關(guān)注我們的官方微信公眾號(ID:ctoutiao),給您更多好看的內(nèi)容。