隨著OpenAI 推出下一代推理模型o3和o3mini,為期12天的年底大促直播,拉下帷幕。
相關(guān)閱讀:最全!OpenAI 12天直播大戲合集(文字+視頻)
略低于的預(yù)期的是,OpenAI并未發(fā)布GPT-5或4.5。
日前,據(jù)《華爾街日報》爆料,OpenAI GPT-5 研發(fā)進度不僅落后于原計劃,且進度不順,投入與產(chǎn)出落差比較大。
據(jù)悉,該項目已開發(fā)超過18個月,也就是說GPT-5已至少完成2輪訓(xùn)練,每次長達數(shù)月,但每次訓(xùn)練后,都遇到新問題。
報道還稱,OpenAI 除了依賴公開數(shù)據(jù)和許可協(xié)議外,還雇傭了人員通過編寫代碼或解決數(shù)學(xué)問題,來創(chuàng)建全新的數(shù)據(jù)。此外,公司還在使用其另一個模型 o1 生成的合成數(shù)據(jù)。
因此,更有可能的事實是,GPT-5并不是OpenAI藏著不發(fā),而是沒準備好。
熱鬧褪去。反觀這12天的密集大促,亮點屈指可數(shù),比如Sora,比如語音搜索。
其中,Sora發(fā)布后,一度遭到嘗鮮用戶的吐槽,被指還不如中國的可靈、海螺AI。
相關(guān)閱讀:Sora發(fā)布即“翻車”,被國外用戶指不如可靈、海螺AI
從跳票,到塌方,Sora 可謂OpenAI的一大污點。于此,對公司非議最多的就是,Openai 很長于營銷,這在其冠冕“全球AI 之王”中,起了不小的作用。
而產(chǎn)品端的進度與表現(xiàn),則屢屢不如預(yù)期。這種反差很要命。
更要命的是,之前被認為一直落后的Google 后勁十足,呈現(xiàn)全面趕超的勢頭。
我們不妨來看看,Google在OpenAI 年底直播季的成績單。
1、Gemini 2.0 Flash:Google的AI模型的一個測試版本,具有更快的響應(yīng)時間,專為使用多種類型輸入和輸出的交互式體驗而構(gòu)建。
2、Veo 2:視頻生成器,可以從文本提示中創(chuàng)建逼真的4K視頻剪輯,并具有可調(diào)節(jié)的相機和拍攝選項。
根據(jù)早期結(jié)果,許多AI圖像專家稱這是迄今為止最好的視頻合成模型。
相關(guān)閱讀:Sora發(fā)布即翻車,谷歌Veo2偷塔AI視頻新王?
3、Imagen 3:Google的新文本到圖像模型,能夠以各種藝術(shù)風(fēng)格創(chuàng)建具有精細細節(jié)、照明和構(gòu)圖的圖像。
4、Gemini 2.0 Flash Thinking:這是一個運行時“推理”AI模型,類似于OpenAI的o1,它使用額外的推理運行時間試圖以更高的準確性解決更復(fù)雜的問題......
其中還包括之前發(fā)布的Project Astra、Project Mariner等更新,都融入了Gemini 2.0。
盡管在營銷手段上,不如12天直播這樣的轟動,但全家桶的產(chǎn)品硬實力讓 OpenAI 承壓很大。
天道好輪回。
OpenAI是當年馬斯克與奧特曼為了反抗Google霸權(quán)的產(chǎn)物。過去OpenAI常常在Google預(yù)期發(fā)布產(chǎn)品前,推出新品,屢屢得手,但現(xiàn)在情況似乎反過來了。
比如,Google通過發(fā)布Gemini Flash 2.0展示了流媒體圖像和視頻,而OpenAI在一天后才將此功能添加到ChatGPT中。
據(jù)lmarena.ai分析,LLM過去6個月,OpenAl與Google兩個實驗室領(lǐng)先于市場。
并且,在2024年11月17日開始Google的Elo得分就開始逐漸反超OpenAl。
根據(jù)OpenRouterAI的數(shù)據(jù),Google Gemini在開發(fā)者中的市場份額從9月份的約5%,上升到了最近的>50%市場份額。
另外,在一些細分領(lǐng)域,OpenAI已經(jīng)王位不保。
比如,OpenAI“叛軍團”組成的的公司Anthropic,在AI編程領(lǐng)域已經(jīng)領(lǐng)先于ChatGPT。
Anthropic的七位聯(lián)合創(chuàng)始人全部來自O(shè)penAI。
據(jù)The information報道,今年秋季OpenAI開展了一次內(nèi)部基準測試。
測試結(jié)果卻是Anthropic的AI編程模型Claude,在關(guān)鍵指標上超越了OpenAI自家的模型。
并且,OpenAI去年投資的初創(chuàng)公司Cursor,在今年7月做出決定,將其默認使用的AI模型從GPT換成了Claude。
Cursor聯(lián)合創(chuàng)始人Aman Sanaer公開稱贊Claude“是當前最佳的編程工具”。
另一家代碼輔助工具公司Source graph也選擇了Claude 3.5 Sonnet作為其默認模型。
他們的數(shù)據(jù)顯示,用戶有66%的時間都偏愛Anthropic的模型,而非傾向于OpenAl、谷歌等其他產(chǎn)品。
客服公司Intercom 也宣布將其客服工單處理AI聊天機器人Fin的底層技術(shù),從OpenAI大模型切換為Claude。
結(jié)果表明,Claude將客服工單的自動解決率提升至51%,而此前由OpenAl模型驅(qū)動的Fin的工單解決率僅為23%。
Anthropic負責(zé)增長和收入的主管Kate Jensen透露,過去三個月,公司來自AI編程客戶的年化收入增長了驚人的10倍。
還有消息稱,Anthropic已經(jīng)完成下一代AI大模型 Claude 3.5 Opus 的訓(xùn)練。
妥妥的不斷壓制。
根據(jù)風(fēng)投機構(gòu)Menlo Ventures的數(shù)據(jù),今年OpenAI在企業(yè)AI領(lǐng)域的市場份額從50%下降至34%,而Anthropic的市場份額翻了一番,從12%增至24%。
OpenAI接下來的挑戰(zhàn)看起來還會更大。
這不僅表現(xiàn)在如上的產(chǎn)品力方面——?OpenAI核心技術(shù)人員的離職不斷,導(dǎo)致的結(jié)果還會不斷顯現(xiàn)。
更重要的是,公司治理、商業(yè)化進程等所組成的可持續(xù)發(fā)展力方面。
眾所周知,AI是一個十分燒錢的行業(yè)。
OpenAI被爆出的融資材料顯示,OpenAI 預(yù)計2023年-2028年期間,總虧損(不包括股權(quán)補償)將達到440億美元。其中,預(yù)計2025年的虧損140億美元,是2024預(yù)期虧損的近三倍。
而OpenAI已有的盈利模式,大都利潤不高,跟不上燒錢的速度。
最近消息顯示,OpenAI正在將其商業(yè)化團隊擴充到300多人,并討論在AI產(chǎn)品中開發(fā)廣告等營收模式。
但不管怎樣,作為一個組建沒幾年的創(chuàng)業(yè)公司,與Google這樣的醒過來、緩過來巨頭相比,還是會相形見絀。
如此種種,可見昔日“AI 之王”頭上的皇冠正搖搖欲墜。但AI之漫漫長跑,才剛剛開始,競逐者的游戲中,不斷反轉(zhuǎn),甚至后來者斜刺的情節(jié),或會不斷上演。
.END.
圖片來源|網(wǎng)絡(luò)
您也可以關(guān)注我們的官方微信公眾號(ID:ctoutiao),給您更多好看的內(nèi)容。