DeepSeek R2的發(fā)布,再一次被推遲了。
據(jù)《The Information》援引知情人士的消息,DeepSeek 內(nèi)部原計(jì)劃在今年 5 月份正式發(fā)布下一代大模型 DeepSeek-R2,但由于目前模型的整體表現(xiàn)尚未達(dá)到公司 CEO 梁文峰的預(yù)期標(biāo)準(zhǔn),發(fā)布計(jì)劃被暫時(shí)擱置。
《The Information》報(bào)道稱,盡管工程團(tuán)隊(duì)已經(jīng)數(shù)月內(nèi)不斷調(diào)優(yōu) R2,但CEO梁文峰在近期評(píng)估后認(rèn)為效果未達(dá)標(biāo),因此未批準(zhǔn)模型發(fā)布,也未設(shè)定新的目標(biāo)日期。
DeepSeek-R2 被寄予厚望。
早在2025年初,其研發(fā)路線就明確指向更強(qiáng)的多語(yǔ)言推理能力和編碼生成能力。在 R1 模型獲得業(yè)內(nèi)較高評(píng)價(jià)后,R2 被視為關(guān)鍵升級(jí)版本。
這一推遲并非完全出人意料。
首先,技術(shù)標(biāo)準(zhǔn)本身就設(shè)定得很高,DeepSeek 在 R1 模型中已經(jīng)展現(xiàn)出“以低成本構(gòu)建高性能推理模型”的能力,因此對(duì)下一代模型提出更高標(biāo)準(zhǔn)本屬自然。
其次,更關(guān)鍵的是芯片供應(yīng)的問題。
《The Information》指出,DeepSeek 正面臨與其他中國(guó) AI 企業(yè)類似的挑戰(zhàn),即高端 AI 訓(xùn)練芯片短缺。
特別是 2024 年 4 月以來,美國(guó)進(jìn)一步收緊了對(duì)華先進(jìn)芯片出口管制,英偉達(dá)的H20 GPU停止供貨,導(dǎo)致訓(xùn)練與部署算力緊張,嚴(yán)重影響了模型迭代速度。
這一現(xiàn)狀在市場(chǎng)層面也有所體現(xiàn)。
據(jù)悉, DeepSeek 已經(jīng)開始與多家中國(guó)云服務(wù)提供商溝通 R2 模型的部署事宜,但這些合作方普遍反饋,現(xiàn)階段他們還主要部署的是 R1 模型,算力環(huán)境也主要基于 H20 GPU。
R2 何時(shí)上線,仍要取決于模型本身的優(yōu)化完成度以及硬件資源是否到位。
根據(jù)彭博社、路透社和 The Information 的綜合報(bào)道,DeepSeek 的技術(shù)路徑和發(fā)布策略,代表了一類中國(guó) AI 企業(yè)的典型特征:對(duì)標(biāo) OpenAI,強(qiáng)調(diào)多模態(tài)、強(qiáng)代碼、成本效能比,在研發(fā)上追求精益求精,在發(fā)布上審慎推進(jìn)。
-END-
您也可以關(guān)注我們的官方微信公眾號(hào)(ID:ctoutiao),給您更多好看的內(nèi)容。