華為GPU已可對標(biāo)英偉達(dá)A100？劉慶峰稱任正非派來三個董事組成專班

2023-08-29 11:11 搶發(fā)第一評

30秒快讀劉慶峰表示，中國人工智能算法已經(jīng)不受制于國外，算力方面也有好消息，“華為的GPU能力現(xiàn)在已經(jīng)跟英偉達(dá)一樣”。據(jù)劉慶峰介紹，華為的GPU技術(shù)現(xiàn)在已經(jīng)與英偉達(dá)A100相當(dāng)，但由于算子庫不全，因此整體效率與英偉達(dá)相比仍存在差距。從大模型產(chǎn)品芯片供應(yīng)情況來看，在AI大模型訓(xùn)練上，現(xiàn)在A100、H100及其特供中國的減配版A800、H800找不到替代品。

640 (8).png

作者｜史慧芳??

編輯｜六耳

來源｜創(chuàng)頭條

2023年亞布力論壇夏季高峰會于8月24日-27日在深圳召開，科大訊飛創(chuàng)始人、董事長劉慶峰出席并演講。

劉慶峰表示，中國人工智能算法已經(jīng)不受制于國外，算力方面也有好消息，“華為的GPU能力現(xiàn)在已經(jīng)跟英偉達(dá)一樣”。

-1-

“華為GPU已與英偉達(dá)A100相當(dāng)”

據(jù)劉慶峰介紹，華為的GPU技術(shù)現(xiàn)在已經(jīng)與英偉達(dá)A100相當(dāng)，但由于算子庫不全，因此整體效率與英偉達(dá)相比仍存在差距。但任正非非常重視這個問題?！叭A為的三位董事作為聯(lián)系工作組到科大訊飛，我們成立了一個專班工作，目前已經(jīng)可以媲美英偉達(dá)A100，這是非常了不起的?！?劉慶峰稱。

“以前百模大戰(zhàn)，基本都是由英偉達(dá)訓(xùn)練的。企業(yè)內(nèi)部只能進(jìn)行微小的調(diào)優(yōu)和訓(xùn)練，而基本的訓(xùn)練模型是比較困難的?！眲c峰表示，這次基本上解決了這個問題。

據(jù)了解，華為這款已經(jīng)與英偉達(dá)A100旗鼓相當(dāng)?shù)腉PU產(chǎn)品應(yīng)該與昇騰910相關(guān)。

大模型的研發(fā)過程，需要可以支撐千億參數(shù)規(guī)模大模型并行訓(xùn)練的算力和框架，還需要幾千張芯片同時連續(xù)運行?；诖?，系統(tǒng)架構(gòu)以及并行訓(xùn)練的集群能力成為大模型研發(fā)的關(guān)鍵。

今年8月15日，在星火認(rèn)知大模型發(fā)布會上劉慶峰表示，科大訊飛與華為共同發(fā)布一款用于企業(yè)構(gòu)建專屬大模型的軟硬件一體化設(shè)備“星火一體機(jī)”，讓所有企業(yè)都可以在國產(chǎn)自主創(chuàng)新的平臺上自主、安全、可控地私有化部署大模型。

據(jù)劉慶峰介紹：“星火一體機(jī)可用于大模型的訓(xùn)練和推理，企業(yè)拎回去，開箱即可用。每一家企業(yè)，每一個行業(yè)、每一個學(xué)校、每個醫(yī)院都可以有機(jī)會構(gòu)建自己的專屬大模型。”

據(jù)第一財經(jīng)報道，星火一體機(jī)使用的是華為尚未官方對外發(fā)布的昇騰910B人工智能芯片。

一位業(yè)內(nèi)人士在接受采訪時稱，“華為昇騰910B芯片的性能從未對外公布，但最近華為在業(yè)內(nèi)大力推廣這一平臺，而且它的性能與上一代的910相比，應(yīng)該絕對不是一個量級?！?/p>

據(jù)了解，星火一體機(jī)也是910B芯片首個對外商業(yè)化應(yīng)用產(chǎn)品。

此外，科大訊飛和華為已在聯(lián)合攻關(guān)算力卡脖子的問題。

劉慶峰在發(fā)布會上表示，正在與華為打造面向超大規(guī)模參數(shù)大模型訓(xùn)練的國產(chǎn)算力的集群，對標(biāo)英偉達(dá)的A100芯片。A100是目前在大模型訓(xùn)練市場上應(yīng)用最廣泛的芯片。

劉慶峰表示：“華為與科大訊飛將共同在生成式軟硬件平臺上，把高算力、高性能的算子庫，多卡的高速互聯(lián)以及分布式存儲結(jié)合起來，尤其是聯(lián)合針對人工智能所需要的最重要的算子庫進(jìn)行甄別和打磨，在此基礎(chǔ)上架構(gòu)科大訊飛的訓(xùn)練和數(shù)據(jù)閉環(huán)的全流程設(shè)計，以及訓(xùn)練和推理一體化設(shè)計的自研的大模型訓(xùn)練平臺?！?/p>

早在今年7月，科大訊飛就與華為宣布，打造基于中國自主創(chuàng)新的通用智能新底座。一方面，訊飛星火認(rèn)知大模型基于訓(xùn)練推理一體化設(shè)計，實現(xiàn)大模型稀疏化、低精度量化的技術(shù)突破，能高效適配昇騰AI，加速大模型的行業(yè)落地應(yīng)用和迭代；另一方面，以昇騰AI為核心，軟硬件協(xié)同優(yōu)化，構(gòu)建算力集中、性能優(yōu)越、供給穩(wěn)定、數(shù)據(jù)安全的大模型訓(xùn)練集群。?

-2-

高端GPU亟需國產(chǎn)替代

國產(chǎn)大模型已形成群模亂舞、百模大戰(zhàn)的局面。

大模型的發(fā)展需要算法、算力、數(shù)據(jù)三大重要因素的支撐，算力是大模型訓(xùn)練的重要能量引擎，也是目前國內(nèi)發(fā)展大模型產(chǎn)業(yè)的一大壁壘。

正所謂“無芯片，不AI”。芯片能力直接影響著高算力訓(xùn)練效果和速度。

當(dāng)前大模型浪潮風(fēng)起云涌，大模型的算力需求飆升，AI芯片迎來了重要商機(jī)。

作為目前全球人工智能算力最大“軍火商”，英偉達(dá)在高性能GPU方面的技術(shù)領(lǐng)先地位。

為了支持大型語言模型推理，英偉達(dá)發(fā)布了一系列圍繞AI領(lǐng)域的產(chǎn)品和服務(wù)，其旗下的A100、H100、A800和 H800等高性能GPU芯片成為搶手貨，一“芯”難求，且價格一路飆升。

盡管國產(chǎn)大模型產(chǎn)品頻出，但從其背后支持的芯片來看，所有這些平臺使用的要么是英偉達(dá) A100、H100 GPU，要么是去年禁令后英偉達(dá)專門推出的減配版 A800、H800。

“國內(nèi)大模型企業(yè)基本上很難拿得到這些芯片。整個市場需大于求，缺貨非常厲害?！蹦畴娮釉骷少徆?yīng)商坦言：“今年，這類GPU芯片從原來的12萬人民幣左右，變成了現(xiàn)在是25萬甚至30萬，甚至有高達(dá)50萬一片”。

如今國內(nèi)頭部科技企業(yè)在AI和云計算方面投入較大。與此同時，中國科技大廠還在進(jìn)行新一輪的采購競爭。

前不久，有報道稱，國內(nèi)各互聯(lián)網(wǎng)大公司也紛紛向英偉達(dá)下大單，百度、阿里、字節(jié)等向英偉達(dá)訂購了數(shù)十億美元的GPU。