作者|史慧芳??
編輯|六耳
來源|創(chuàng)頭條
2023年亞布力論壇夏季高峰會于8月24日-27日在深圳召開,科大訊飛創(chuàng)始人、董事長劉慶峰出席并演講。
劉慶峰表示,中國人工智能算法已經(jīng)不受制于國外,算力方面也有好消息,“華為的GPU能力現(xiàn)在已經(jīng)跟英偉達(dá)一樣”。
-1-
“華為GPU已與英偉達(dá)A100相當(dāng)”
據(jù)劉慶峰介紹,華為的GPU技術(shù)現(xiàn)在已經(jīng)與英偉達(dá)A100相當(dāng),但由于算子庫不全,因此整體效率與英偉達(dá)相比仍存在差距。但任正非非常重視這個問題?!叭A為的三位董事作為聯(lián)系工作組到科大訊飛,我們成立了一個專班工作,目前已經(jīng)可以媲美英偉達(dá)A100,這是非常了不起的?!?劉慶峰稱。
“以前百模大戰(zhàn),基本都是由英偉達(dá)訓(xùn)練的。企業(yè)內(nèi)部只能進(jìn)行微小的調(diào)優(yōu)和訓(xùn)練,而基本的訓(xùn)練模型是比較困難的?!眲c峰表示,這次基本上解決了這個問題。
據(jù)了解,華為這款已經(jīng)與英偉達(dá)A100旗鼓相當(dāng)?shù)腉PU產(chǎn)品應(yīng)該與昇騰910相關(guān)。
大模型的研發(fā)過程,需要可以支撐千億參數(shù)規(guī)模大模型并行訓(xùn)練的算力和框架,還需要幾千張芯片同時連續(xù)運行?;诖?,系統(tǒng)架構(gòu)以及并行訓(xùn)練的集群能力成為大模型研發(fā)的關(guān)鍵。
今年8月15日,在星火認(rèn)知大模型發(fā)布會上劉慶峰表示,科大訊飛與華為共同發(fā)布一款用于企業(yè)構(gòu)建專屬大模型的軟硬件一體化設(shè)備“星火一體機(jī)”,讓所有企業(yè)都可以在國產(chǎn)自主創(chuàng)新的平臺上自主、安全、可控地私有化部署大模型。
據(jù)劉慶峰介紹:“星火一體機(jī)可用于大模型的訓(xùn)練和推理,企業(yè)拎回去,開箱即可用。每一家企業(yè),每一個行業(yè)、每一個學(xué)校、每個醫(yī)院都可以有機(jī)會構(gòu)建自己的專屬大模型。”
據(jù)第一財經(jīng)報道,星火一體機(jī)使用的是華為尚未官方對外發(fā)布的昇騰910B人工智能芯片。
一位業(yè)內(nèi)人士在接受采訪時稱,“華為昇騰910B芯片的性能從未對外公布,但最近華為在業(yè)內(nèi)大力推廣這一平臺,而且它的性能與上一代的910相比,應(yīng)該絕對不是一個量級?!?/p>
據(jù)了解,星火一體機(jī)也是910B芯片首個對外商業(yè)化應(yīng)用產(chǎn)品。
此外,科大訊飛和華為已在聯(lián)合攻關(guān)算力卡脖子的問題。
劉慶峰在發(fā)布會上表示,正在與華為打造面向超大規(guī)模參數(shù)大模型訓(xùn)練的國產(chǎn)算力的集群,對標(biāo)英偉達(dá)的A100芯片。A100是目前在大模型訓(xùn)練市場上應(yīng)用最廣泛的芯片。
劉慶峰表示:“華為與科大訊飛將共同在生成式軟硬件平臺上,把高算力、高性能的算子庫,多卡的高速互聯(lián)以及分布式存儲結(jié)合起來,尤其是聯(lián)合針對人工智能所需要的最重要的算子庫進(jìn)行甄別和打磨,在此基礎(chǔ)上架構(gòu)科大訊飛的訓(xùn)練和數(shù)據(jù)閉環(huán)的全流程設(shè)計,以及訓(xùn)練和推理一體化設(shè)計的自研的大模型訓(xùn)練平臺?!?/p>
早在今年7月,科大訊飛就與華為宣布,打造基于中國自主創(chuàng)新的通用智能新底座。一方面,訊飛星火認(rèn)知大模型基于訓(xùn)練推理一體化設(shè)計,實現(xiàn)大模型稀疏化、低精度量化的技術(shù)突破,能高效適配昇騰AI,加速大模型的行業(yè)落地應(yīng)用和迭代;另一方面,以昇騰AI為核心,軟硬件協(xié)同優(yōu)化,構(gòu)建算力集中、性能優(yōu)越、供給穩(wěn)定、數(shù)據(jù)安全的大模型訓(xùn)練集群。?
-2-
高端GPU亟需國產(chǎn)替代
國產(chǎn)大模型已形成群模亂舞、百模大戰(zhàn)的局面。
大模型的發(fā)展需要算法、算力、數(shù)據(jù)三大重要因素的支撐,算力是大模型訓(xùn)練的重要能量引擎,也是目前國內(nèi)發(fā)展大模型產(chǎn)業(yè)的一大壁壘。
正所謂“無芯片,不AI”。芯片能力直接影響著高算力訓(xùn)練效果和速度。
當(dāng)前大模型浪潮風(fēng)起云涌,大模型的算力需求飆升,AI芯片迎來了重要商機(jī)。
作為目前全球人工智能算力最大“軍火商”,英偉達(dá)在高性能GPU方面的技術(shù)領(lǐng)先地位。
為了支持大型語言模型推理,英偉達(dá)發(fā)布了一系列圍繞AI領(lǐng)域的產(chǎn)品和服務(wù),其旗下的A100、H100、A800和 H800等高性能GPU芯片成為搶手貨,一“芯”難求,且價格一路飆升。
盡管國產(chǎn)大模型產(chǎn)品頻出,但從其背后支持的芯片來看,所有這些平臺使用的要么是英偉達(dá) A100、H100 GPU,要么是去年禁令后英偉達(dá)專門推出的減配版 A800、H800。
“國內(nèi)大模型企業(yè)基本上很難拿得到這些芯片。整個市場需大于求,缺貨非常厲害?!蹦畴娮釉骷少徆?yīng)商坦言:“今年,這類GPU芯片從原來的12萬人民幣左右,變成了現(xiàn)在是25萬甚至30萬,甚至有高達(dá)50萬一片”。
如今國內(nèi)頭部科技企業(yè)在AI和云計算方面投入較大。與此同時,中國科技大廠還在進(jìn)行新一輪的采購競爭。
前不久,有報道稱,國內(nèi)各互聯(lián)網(wǎng)大公司也紛紛向英偉達(dá)下大單,百度、阿里、字節(jié)等向英偉達(dá)訂購了數(shù)十億美元的GPU。
從大模型產(chǎn)品芯片供應(yīng)情況來看,在AI大模型訓(xùn)練上,現(xiàn)在A100、H100及其特供中國的減配版A800、H800找不到替代品。
在如此瘋炒以及中國大科技公司對于采購GPU非常急迫之下,中國急需中國版的“英偉達(dá)”出現(xiàn),打破“缺芯”局面,實現(xiàn)國產(chǎn)替代。?
.END.
圖片來源|網(wǎng)絡(luò)