【工信部副部長 徐曉蘭】
我國人工智能產(chǎn)業(yè)蓬勃發(fā)展。一是產(chǎn)業(yè)體系逐步完善,核心產(chǎn)業(yè)規(guī)模達到5000億元,企業(yè)數(shù)量超過4300家,智能芯片開發(fā)框架、通用大模型等創(chuàng)新成果不斷涌現(xiàn)。二是基礎設施加快布局,云算、智算、超算等協(xié)同發(fā)展,算力規(guī)模位居全球第二,東數(shù)西算等重大工程加快推進,5G基站超過280萬個,開展了工業(yè)數(shù)據(jù)標注登記試點工作。三是融合應用深度拓展,人工智能與制造業(yè)深度融合,有力地推動了實體經(jīng)濟數(shù)字化、智能化、綠色化轉(zhuǎn)型。已建成2500多個數(shù)字化車間和智能工廠,經(jīng)過智能化改造,研發(fā)周期縮短了約20.7%,生產(chǎn)效率提升了約34.8%,不良品率降低了約27.4%,碳排放減少了約21.2%。
上海是我國人工智能產(chǎn)業(yè)創(chuàng)新發(fā)展的高地,在技術創(chuàng)新、產(chǎn)業(yè)集聚、行業(yè)賦能、先導區(qū)建設等方面都取得了明顯的成效。世界人工智能大會已成為全球人工智能領域重要的合作平臺,希望各方以大會為平臺,加強交流,凝聚共識,深化合作,共同推動人工智能健康發(fā)展,攜手開啟智能產(chǎn)業(yè)發(fā)展的新篇章。
【埃隆·馬斯克】
大家好,上海的各位朋友們,尤其是陳書記您好!我覺得,人工智能將會在未來人類的演進中,包括對文明,產(chǎn)生深刻的作用和影響,我們也看到了,數(shù)字計算能力爆炸式的增長。最關鍵要考慮的一個指標,就是數(shù)字計算、機器計算和生物算力的比率。
什么意思呢?就是人類能做多強的計算,計算機和機器能做多強的計算,計算機和人類算力的比率是多少?每年的這個比率都在越來越高,這就意味著機器和生物算力之間的差距在進一步地擴大,經(jīng)過一段時間之后,相比于機器智能而言,人類的智能所占的比例會越來越低,這將是一個根本性的、深度的變化。而其所帶來的影響,目前也很難預知。
但是可能這是人類歷史上最深刻的一個時期。特斯拉的Optimus人形機器人還在比較早期的開發(fā)階段,但是在未來,我們將會有非常多的機器人。那么,馬上需要考慮的又是一個比率的問題,也就是機器人和人類的比例。
現(xiàn)在看來,下一階段將會超過1 : 1,也就是說,地球上機器人的數(shù)量將會超過人類的數(shù)量。它們的計算能力要強很多,這似乎是一個發(fā)展的趨勢。這會有積極的影響,也會帶來一些消極的影響。
積極的影響就是,我們將會進入到一個“后稀缺”時代,不會再有短缺了,那么這個時代將會是一個富足的時代,只要你想要的,立刻就能夠獲得。因為未來世界里面,在有非常多機器人的情況下,生產(chǎn)效率將會比人類為主導的生產(chǎn)效率高很多,所以這是非常大的變化。所以我們要很小心,以確保它最終的結果是有助于人類的。
但現(xiàn)有的發(fā)展趨勢是,比如說在特斯拉的人形機器人領域里,我們也看到如今機器人越來越多。Optimus人形機器人就能夠幫助人做一些工作,它也不是非常強的智能,但是有足夠的能力來做一些無聊的、重復的而且危險的、人類不愿意做的工作,這是我們的目的。Optimus人形機器人的一個目標就是做這些人類不想做的事,這可能會是比較有用的。我也不想現(xiàn)在過度地自信或者樂觀地認為特斯拉Optimus的角色一定會很重要。
在自動駕駛這塊,特斯拉也非常有興趣將自己自動駕駛的技術與其他的汽車制造商進行分享和技術許可。我們覺得這是一個非常有用的技術,讓大家和無聊的駕駛過程就徹底再見了,這是超越時代的。
同時,汽車的使用率也會大大增加。一般情況下,一輛家用車一周大概是10-20小時的使用時間,多數(shù)的時間都是在停車場里停著的,但是對于全自動駕駛的汽車來說,它可使用時間可能會是一周50-60小時(一周總共就168個小時)。所以就使用率而言,全自動駕駛汽車將近是非全自動駕駛汽車的5倍。
在特斯拉,我們也想提供這樣的技術,這也是為什么我們愿意把全自動駕駛技術許可給其他的汽車制造商來加以使用。那么當前我們自動駕駛的狀態(tài)如何?特斯拉已經(jīng)非常接近沒有人類干預的全自動駕駛狀態(tài)了。我們已經(jīng)在美國的道路上測試了,現(xiàn)在很少會需要人工干預。所以我在開一輛特斯拉,使用最新FSD完全自動駕駛Beta版的技術系統(tǒng)時,基本上不需要摸什么方向盤了。
所以我預測,要實現(xiàn)全自動駕駛,或者說L4-L5級的全自動駕駛,大概今年晚一點的時候就能實現(xiàn)了。
我以前也做過預測,雖然都錯了,但是我覺得此刻做的這個預測,比以往任何時候都更接近于現(xiàn)實。
還有一個點是,對這種深度的、全面的人工智能要保持擔心,尤其是全自動駕駛汽車。比如說在這個例子里,對我們來說,有局限的AI去做全自動駕駛汽車是有難度的,但是我們覺得很快能夠加以解決。我已經(jīng)預測了,大概今年晚一點的時候就能夠?qū)崿F(xiàn)全自動駕駛,雖然不能100%保證,但是趨勢是這樣的。
這種有局限的人工智能,和一個全面的人工智能的情況完全不一樣。全面人工智能很難去定義,全面人工智能比人類在任何一個領域都要聰明得多。特斯拉沒有做這方面的研究,其他公司在做全面人工智能的研究,但是我覺得這是我們需要去考慮的,現(xiàn)在需要對他們進行一些監(jiān)管,從而確保這種非常深度的人工智能。
我說的這種人工智能接近于幾萬臺、幾十萬臺甚至幾百萬臺的高性能計算機,在一個數(shù)據(jù)中心里面進行協(xié)作,產(chǎn)生一個組合的超級智能。它有強大的能力,比人類要強大。這是一種風險,一種擔憂。它可能會有很積極的未來,但也有可能會出現(xiàn)一些負面的未來,我們要盡自己的可能確保這些負面的消極的未來不會發(fā)生。
中國有非常多智慧的人,我一直非常欽佩中國人民的智慧和干勁,中國一旦下定決心要做一件事的話,一定都能把這個產(chǎn)業(yè)做得很好,在各個經(jīng)濟領域、各個產(chǎn)業(yè)都是這樣的,當然也包括人工智能產(chǎn)業(yè)。所以我相信中國會有很強的AI能力,這是我的預測。
非常感謝大家邀請我來出席今天的活動,在線上表達一些觀點,希望大家覺得這些觀點有意思。再次感謝上海的各位朋友,感謝陳書記,我期待下一屆能夠線下參加。
【香港中文大學教授 湯曉鷗】
【共贏人工智能新時代】
華為輪值董事長 胡厚崑
兩個關鍵的舉措或抓手是:一方面是生根算力,打造強有力的算力底座來支撐中國的人工智能事業(yè)的發(fā)展;另一方面是結合大模型,從通用大模型到行業(yè)大模型的研究創(chuàng)新,真正讓人工智能服務各行各業(yè)和科學研究。因此,我們提出了“AI for industry”和“AI for science”。
下面我將向大家詳細匯報。
首先,關于算力,人工智能的發(fā)展離不開算力。在當前中國的情況下,我們面臨著算力可獲得性和成本等方面的挑戰(zhàn)。多年來,華為一直專注于算力的發(fā)展。我們聚焦于鯤鵬和昇騰的根基,取得了突破。目前,我們正在通過架構創(chuàng)新、生態(tài)發(fā)展和靈活的共建方式來打造中國的算力底座。我們希望通過與大家的共同努力,消除算力對人工智能發(fā)展的制約。
首先,我們通過架構創(chuàng)新提升計算效率。例如,在計算節(jié)點層面,我們推出了革命性的對等評購架構,突破了傳統(tǒng)以CPU為中心的異構計算帶來的性能瓶頸,提高了整個計算的帶寬,降低了時延,使節(jié)點性能提升了30%。
另一方面,在數(shù)據(jù)中心層面,我們在2019年推出了昇騰AI計算集群。通過集群方式,我們將計算、存儲、網(wǎng)絡和能源等優(yōu)勢集中在一起,將AI數(shù)據(jù)中心設計和管理成一臺超級計算機,大幅提升了性能。
目前,我們在國內(nèi)建設的規(guī)模最大的AI計算集群是位于深圳的鵬城云腦二期,目前算力規(guī)模為1000P。根據(jù)我們的規(guī)劃,到2024年鵬城云腦三期的規(guī)模將達到16000P。此外,我們還在烏蘭察布的計算中心部署了數(shù)千卡的規(guī)模,并實測發(fā)現(xiàn)通過集群方式,在相同算力下可以提升10%以上的效率。
下面我將向大家報告生態(tài)發(fā)展,因為生態(tài)是算力產(chǎn)業(yè)發(fā)展的關鍵手段,同時也是一個難以攻克的瓶頸。
四年前,華為提出了硬件開放、軟件開源和人才培養(yǎng)的戰(zhàn)略,圍繞計算產(chǎn)業(yè)的發(fā)展展開。通過與各方合作,我們?nèi)〉昧艘欢ǖ某煽?。在硬件方面,我們堅持進一步開放,今年推出了更多樣化的模組和板卡,與30多家硬件伙伴合作,基于昇騰推出了上百款人工智能硬件,滿足不同行業(yè)的需求。
在軟件方面,我們通過開源加強基礎軟件,特別是針對當前大模型的創(chuàng)新。我們提供全流程的使能平臺,更好地支持科研機構和企業(yè)客戶。目前,我們的生態(tài)已經(jīng)孵化了20多個基礎大模型,并適配了十多個業(yè)界主流的大模型。
統(tǒng)計數(shù)據(jù)顯示,中國目前一半的大模型都得到了AI昇騰算力的支持。因此,我特別感謝那些使用了AI昇騰算力的公司和機構,感謝他們對我們的信任,這讓我們對未來發(fā)展算力生態(tài)更加有信心。當然,我們也清楚,生態(tài)的發(fā)展沒有捷徑,必須腳踏實地地前進。我們希望未來有更多的公司加入我們的行列,共同打造好這個生態(tài)。
在發(fā)展算力方面,我們還考慮到身段的靈活性和多樣化的手段和模式,這是基于中國的實際情況得出的結論。因此,我們采用多種模式進行算力建設。例如,在城市的算力基礎設施建設方面,我們已經(jīng)支持各地政府打造了25個城市級的人工智能計算中心,其中包括上海。
另一方面,我們注意到許多大型企業(yè)都有自建人工智能算力中心的需求,因此我們積極配合并幫助這些企業(yè)建立自己的人工智能算力中心。例如,中國移動、科大訊飛、南方電網(wǎng)等大企業(yè)都在進行建設,我們也積極參與其中。
同時,我們意識到中小企業(yè)對人工智能的需求非常旺盛。為了滿足這些需求,我們通過云服務的方式在華為云上提供算力服務,將多種手段結合起來。我們希望通過這種方式真正實現(xiàn)算力不再成為人工智能發(fā)展的瓶頸。華為在深耕算力的同時,還致力于讓人工智能服務千行百業(yè)和科學研究。
在這方面,我們認為一方面要不斷提升通用大模型的能力,同時要探索通用大模型與行業(yè)大模型的結合。舉個例子,如果我住在福田區(qū),家里有一位78歲的老人,我想知道政府是否能提供補貼。如果我們使用通用大模型,它會給出什么樣的答案?同時,我們再看看如果使用行業(yè)大模型,它又會給出什么樣的答案。
這個行業(yè)大模型是我們與深圳市福田區(qū)合作開發(fā)的政務大模型。很顯然,行業(yè)大模型在通用大模型的基礎上能夠給出更精準、更有價值的答案。這是我們努力的方向。
為此,華為推出了三層大模型結構,最底層是基礎大模型,我們將其比喻為"讀萬卷書",它的目標是學習海量的基礎知識。在這一層之上,我們打造了行業(yè)模型和場景模型,我們將其比喻為"行萬里路"。從"讀萬卷書"到"行萬里路"還有許多挑戰(zhàn)需要克服,關鍵之一是將各行各業(yè)的知識與大模型充分匹配和融合。在這方面,華為正在與各行業(yè)伙伴共同努力。
目前,華為的盤古大模型已經(jīng)支持金融、制造、政務、電力、煤礦、醫(yī)療、鐵路等十多個行業(yè)的400多個業(yè)務場景的AI應用落地。未來,我們希望與更多行業(yè)合作伙伴攜手擴大這個面,深化合作,真正做到走得更深、做得更實。
除了讓人工智能服務于千行百業(yè),我們認為當前還有一個重要任務,那就是讓人工智能服務于科學研究。我們提出了"AI for science"的口號。我們發(fā)現(xiàn),通過學習海量的歷史數(shù)據(jù)和科學知識,并將數(shù)學方程編碼到我們的大模型中,AI可以促進與基礎學科(如分子動力學、流體力學、傳熱學、生物學等)的結合,幫助我們發(fā)現(xiàn)更多科學規(guī)律。
目前,華為已經(jīng)發(fā)布了盤古科學計算大模型,其中包括藥物分子模型、盤古氣象模型和海浪模型等。我們與科學家合作取得了不錯的成果。例如,在氣象研究領域,我們的盤古大模型可以在幾秒鐘內(nèi)完成對未來全球一個小時到七天的氣象預報,速度快且準確。這需要充分學習40多年的氣象數(shù)據(jù),并結合行業(yè)知識進行訓練和校正。我們正在多個科學研究領域展開不斷的訓練和校正工作。通過我們的努力,我們希望為科學家和科研工作者帶來更多新的思路、方法和工具,為人類社會的發(fā)展注入新的動力。
最后,我想打個小廣告,因為明天我們?nèi)A為將舉辦全球開發(fā)者大會,屆時我們將詳細介紹華為盤古大模型3.0,以及我們?nèi)绾螢榍邪贅I(yè)和科學研究提供服務。希望大家關注。各位朋友們,我們非常幸運地共同見證了科技革命的幾次浪潮,從互聯(lián)網(wǎng)到移動化到云計算再到人工智能,每一輪變革都給社會帶來了深遠的影響。毫無疑問,通用人工智能給我們帶來了無限的想象空間,也引領我們進入下一個黃金十年。我們希望與大家攜手創(chuàng)新,讓人工智能更好地服務千行百業(yè),更好地服務科學研究。AI for industry,AI for science,讓我們共同贏得人工智能的新時代。
【卓越人工智能引領者獎 SAIL Award】
【重大創(chuàng)新成果首秀】
【AI時代的科技合作】
沈向洋? ? ? ?微軟原執(zhí)行副總裁;美國國家工程院外籍院士
賽義夫·拉曼? ? ? ? IEEE主席兼首席執(zhí)行官
Q:簡單介紹一下IEEE
拉曼教授:IEEE在全球有 43 萬多個會員,中國會員數(shù)是第三大的,所以說我們不僅僅有我們的會員,同時我們也開發(fā)相關的標準,我們還會出版論文、組織一些會議,這些都是非常重要的。IEEE 每年都會舉辦 2000 多場的會議,在這 2000 多場會議當中有 200 場是在中國舉行的。
Q:您能不能簡單的來講一下 IEEE在AI方面做了什么?
拉曼教授:就像前面的這個伊隆馬斯克講到的AGI,我們很多AI工作也是開源的,希望保證人工智能整體的發(fā)展是開放的。我們提供了一個平臺,提供了一個基礎,讓科學家、工程師和開發(fā)者能夠共同的來看來討論他們所做的工作,希望這樣能夠確保我們能夠加以控制。
Q:我們還是要對AI有一定的監(jiān)管,我們也認識到了社會的力量,比如說微軟和谷歌,包括其他的公司也成為了我們的partner,成立 Bing AI 組織,它的影響力也非常的大。除此之外,我覺得像 IEEE這個組織也有很大的力量,因為你們是一個中立的位置,你們可以去影響相關的公司和國家。
拉曼教授:作為 IEEE 的主席,我關注開放性和全球化,也多次強調(diào)好的科學,無論發(fā)生在哪里,對于各地的科學都是有好處的。我們大家都要共同的來進行探討,我也是鼓勵開放的科學,同時也鼓勵大家在我們的會議和期刊當中發(fā)表,可以提高可見度。我們今天的會議就是一個很好的例子,我也希望能夠看到這所有的這些成果,不僅僅是在上海,在全球都有可見度,我們的這些知識可以變得更加的實際。
Q:我知道您非常關注專業(yè)人士的職的發(fā)展,特別是擴充中國 IEEE 的會員的數(shù)量,能跟我們來分享一下您的組織目前在這方面所做的一些工作嗎?
拉曼教授:IEEE每年出版的論文來自于中國的大概有 30 多萬個作者,有很多的中國的作者都在我們的期刊上發(fā)表論文。我們在幾年之前在中國設立了一個社區(qū),鼓勵更多工程師成為我們的會員和高級會員。
Q:在 AI 的時代,你們又會做些什么呢?比如說期刊、會議會不會有所改變?因為能夠有新的形式來幫助人們更多的去理解相關AI知識,這一點我覺得非常的好。
拉曼教授:其實從疫情當中我們也學習了很多,疫情當中我們不能夠有很多的旅行,現(xiàn)在會議是混合形態(tài)的,有很多是網(wǎng)上的會議,我們也會有全息影像的會議,感覺非常的有現(xiàn)實感。
【拓展“生成”機遇,“智聯(lián)”產(chǎn)業(yè)創(chuàng)新】
侯陽? 微軟全球資深副總裁;微軟大中華區(qū)董事長兼首席執(zhí)行官
今年世界人工智能大會的主題是智聯(lián)世界,生成未來,我也想借此機會在這里與大家分享微軟在拓展生成式人工智能的生態(tài)創(chuàng)新,以及加速推進產(chǎn)業(yè)智聯(lián)的過程中收獲的一些經(jīng)驗和思考。人工智能作為科研項目最早出現(xiàn)在 1956 年,至今已經(jīng)發(fā)展了將近 70 年。隨著去年底 ChatGPT 的一夜爆紅,大模型和AIGC,生成式人工智能仿佛在瞬間爆發(fā),甚至很多科技行業(yè)的從業(yè)者都對 AIGC 的突然涌現(xiàn)感到驚詫不已。其實在微軟看來,所謂的涌現(xiàn)也絕非偶然,無數(shù)優(yōu)秀的科研人員數(shù)十年如一日的研究基礎以及海量計算資源的投入,才造就了這樣的創(chuàng)新的成果。
也許大家知道, OpenAI ChatGPT 的突破靠的正是微軟智能云提供的基礎架構和算力支持。從 2019 年開始,微軟就和 OpenAI 展開深度合作,以海量的云計算資源支持 OpenAI 大語言模型的研究。而雙方戰(zhàn)略合作的基礎就在于,我們兩家公司都真誠的希望創(chuàng)造出造福每一家企業(yè)和每一位消費者的人工智能技術。
在今年1月的達沃斯世界經(jīng)濟論壇上,微軟的 CEO 納德萊先生提到,人工智能的黃金時代已經(jīng)到來,微軟智能云也由此開啟了加速上新的模式。我們將最新的 AI 智能技術與企業(yè)級的云服務全面的融合,從而賦能廣大企業(yè)在產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型進程中實現(xiàn)真正的數(shù)智融合。我們的 Azure Open AI 企業(yè)版服務推出了包括 GPT 4 和企業(yè)級 ChatGPT 在內(nèi)的五大模型,支持客戶創(chuàng)造不同產(chǎn)業(yè)需要的定制化的智能服務。同時圍繞 Microsoft 365 辦公 Dynamics 365 商業(yè)應用、 GitHub 開源社區(qū)開發(fā)、數(shù)字信息安全保護、員工體驗提升以及我們每個人所熟悉的 Windows 操作系統(tǒng),微軟也推出了一系列由 AI 驅(qū)動的 Copilot 智能副駕服務,用戶可以用自然語言提出需求, Copilot 就能幫用戶高效的完成一系列的任務,比如快速的寫代碼,開發(fā)出一個應用,或者根據(jù)演講的提綱要點設計出一整套圖文并茂的 PPT 演示稿。
剛才我舉例的這些場景在今天已并非憑空的虛構,這是微軟在內(nèi)的很多企業(yè)已經(jīng)實踐的現(xiàn)實的工作場景,比如備受關注的OpenAI 企業(yè)級服務上線幾個月以來,已經(jīng)得到了超過全球 4500 家企業(yè)的首肯,在制造、零售、金融、服務等多行業(yè)的生產(chǎn)環(huán)境中,已經(jīng)在實踐智能化的創(chuàng)新。再比如用于輔助編程的 GitHub Copilot 自推出一年半以來,已經(jīng)有全球 100 多萬的開發(fā)者在使用,他們有將近一半的代碼都已經(jīng)有 Copilot 幫助完成,并且編程的速度提升了 50% 以上。在全球客戶對微軟人工智能服務的這些積極的嘗試當中,我們不僅看到了企業(yè)加速數(shù)字化轉(zhuǎn)型的創(chuàng)新熱情,更是感受到了市場對新一代生成式人工智能的迫切的需求。因此,微軟也在不斷的持續(xù)加大投入,全力推進生成式人工智能的發(fā)展和普及。在今年5月舉辦的微軟全球開發(fā)者大會上,微軟就連續(xù)發(fā)布了超過 50 項與生成式人工智能開發(fā)相關的新技術和新服務。
其中最重要的一項是我們向全球開發(fā)者開放了 Copilot 智能副駕與 plugins 插件拓展體系,讓全球各地的開發(fā)者、合作伙伴和企業(yè)用戶都能夠抓住生成式人工智能帶來的創(chuàng)新機遇,創(chuàng)造出前所未有的新一代的智能應用。其中, 智能 plugins 插件拓展體系采用與 OpenAI 相同的技術標準,它可以在第三方應用、客戶、業(yè)務場景和生成式人工智能之間構建起安全可靠的連接,通過 plugins 接入實時更新的信息流以及多種多樣的應用和服務,就可以為 AI 系統(tǒng)添加更具專業(yè)性的計算能力,創(chuàng)造出種類更豐富、使用更便捷、信息更準確的智能副駕式的對話服務。
預計到微軟 Microsoft 365 Copilot 正式發(fā)布的時候,我們將提供超過 1000 種 plugins 插件供開發(fā)者選擇。而更加豈值得期待的是,全球的開發(fā)者和合作伙伴將有能力自主運用這些插件接口和智能服務,開發(fā)出更多更豐富的、獨樹一幟的智能副駕駛的創(chuàng)新應用。
毫無疑問,這些是基于自能自然語言對話的新一代的智能交互應用,將為我們開啟一個更加精彩紛呈的數(shù)字世界。微軟堅信,今后任何一家公司都需要具備駕馭數(shù)字技術的能力。我們也看到隨著生成式人工智能不斷展現(xiàn)出的巨大潛力,今后每一家公司的每一個應用程序都將由人工智能來驅(qū)動。人工智能的技術突破也正在為各行各業(yè)帶來千載難逢的創(chuàng)新機遇和挑戰(zhàn),這也促使我們思考如何用它來提升企業(yè)自身的創(chuàng)造力和競爭力。
在實現(xiàn)技術突破的同時,微軟就在思考如何將研究成果轉(zhuǎn)化為生產(chǎn)力。我們希望在第一時間將生成式人工智能與產(chǎn)業(yè)的需求相結合,加速產(chǎn)業(yè)的升級和創(chuàng)新。我在這里展示的是根據(jù)近期全球客戶的產(chǎn)業(yè)智能化解決方案,總結出的六個重點的行業(yè)應用人工智能的創(chuàng)新化場景,比如我們可以革新零售電商的智能客服,實現(xiàn)互動式的搜索,引導消費的趨勢。我們還可以在游戲中構建栩栩如生的 NPC 角色,生成無限的劇情和擬真的對白。在金融行業(yè),我們可以隨時獲取金融市場實施行情的分析報告,更早的發(fā)現(xiàn)、更快的管控潛在的金融交易風險。同時在生命科學研究領域,我們也可以提升臨床實驗數(shù)據(jù)的分析能力,加速藥品和疫苗的研究,實現(xiàn)更精準的醫(yī)療影像識別和診斷。同時在教育領域,我們可以也為學生帶來更具啟發(fā)性、交互性、定制化并且不受地域限制的探索式的學習方式,我們可以幫助培養(yǎng)更適合未來市場需求的有創(chuàng)造力和終身學習能力的人才。
隨著生成式人工智能不斷加速產(chǎn)業(yè)融合,相信在今后的幾個月,將會有更多豐富多彩、充滿想象力的應用場景不停的涌現(xiàn)出來。在人工智能加速發(fā)展的過程中,不可避免會出現(xiàn)人們對潛在的安全風險的擔憂。微軟一直倡導并嚴格的恪守打造負責任的人工智能的六大原則,我們也始終嚴格遵守與數(shù)據(jù)隱私安全合規(guī)相關的各項的要求。同時,我們也積極地倡導全球科技企業(yè)通過交流合作形成產(chǎn)業(yè)共識,確保我們所開發(fā)的人工智能技術能夠負責任地造福全人類。
面對新一輪的技術變革帶來的巨大的創(chuàng)新機遇,微軟在中國愿意從我們自身的技術和優(yōu)勢資源出發(fā),深耕中國的本土生態(tài)系統(tǒng),與全國各地各行各業(yè)的企業(yè)組織和合作伙伴持續(xù)的拓展技術交流和業(yè)務合作,與全國不斷的發(fā)掘數(shù)字化智能在各個產(chǎn)業(yè)中的應用潛力,真正的推進各行業(yè)的智能化創(chuàng)新與數(shù)字化轉(zhuǎn)型,貢獻我們最積極的力量。
【圓桌論壇】
徐立(主持人)? ? 商湯科技董事長兼CEO
姚期智? ? ?圖靈獎得主、上海期智研究院院長
袁洋? ? ? ? 清華大學交叉信息研究院助理教授
楊植麟? ? ?清華大學交叉信息研究院助理教授、Moonshot Al創(chuàng)始人
潘新鋼? ? ?DragGAN第一作者、南洋理工大學計算機科學與工程學院助理教授
Q:大模型發(fā)展有哪些基礎理論的突破?未來的發(fā)展方向?
姚院士:ChatGPT之后一個重要的目標,是要讓機器人擁有多種模態(tài)的感知能力,能夠自主學習新技能。一般的強化學習方法太慢了,高陽老師的一個在算法上的突破是把現(xiàn)在主流的強化學習加快數(shù)百倍,幾個小時之內(nèi)就可以做到。它不僅是一個實用的問題,也是理論的貢獻,在過去的六七年里面,人工智能在最高層上有一個路線之爭,現(xiàn)在依賴強化學習這條路線是不是正確?高陽教授的突破加重天平方向的另外一邊,就是我們應該堅持現(xiàn)在這條路。
Q:交叉學科對大模型的發(fā)展有什么幫助?
袁洋:多模態(tài)肯定是很重要的,但是我覺得大家對多模態(tài)的理解可能比較粗糙,大家往往想到的多模態(tài)是能夠看圖片、看文字,有觸覺、有溫度的感覺。但是我覺得要真正解決行業(yè)里的問題,多模態(tài)需要做的更細致一些。比如說我們?nèi)绻皇强紤]文本到圖片的一個生成,模型生成一個狗的圖片,可能你會發(fā)現(xiàn)狗的圖片不是你想要的姿態(tài)或者模式,然后你可以用鼠標來拖動一下,修改一下。鼠標拖動的這種方式在我看來這是就是一種新的模態(tài),用戶用一種比較好的方式把自己想要表達的內(nèi)容告訴大模型,讓他能夠理解。這種多模態(tài)的輸入我覺得在具體應用中非常重要。到更具體的一些行業(yè),比如說醫(yī)療、法律、教育,我們可能不應該只是把文本或者圖像等專業(yè)的數(shù)據(jù)給模型,就希望他能夠解決專業(yè)的問題。我們應該去深耕這個行業(yè),去找到它里面最核心的問題是什么,然后再去找在這個問題里面我們到底需要什么模態(tài)的數(shù)據(jù)、什么樣的信息能夠精準表達我們想要解決的問題,我稱為是一種模態(tài)的補全。然后我們也需要收集足夠的數(shù)據(jù),做好模態(tài)的對齊。模態(tài)補全、模態(tài)對齊做好之后,我相信它能夠賦予大模型更強大的能力,來解決更核心的交叉領域的問題。
Q:大模型實際應用中的挑戰(zhàn)?
楊植麟:現(xiàn)在確實有很多大模型方面的問題還沒有解決,比如說怎么讓它做到非??煽亍⒈苊猱a(chǎn)生幻覺等。很重要的一個點是我們?nèi)ニ伎歼@些問題的時候,不是要單點思考某個問題,而是尋找底層本質(zhì)的通用問題,更系統(tǒng)的去抽象出來這些問題之間底層都是什么樣共通的問題,回到更本質(zhì)的一個層面去解決。
Q:GAN和Diffusion模型的路線之爭?
潘新鋼:兩個模型三個主要差異:1)性能和效率的trade off:顯然擴散模型需要的算力更大,迭代式的計算所需要的 inference 時間和訓練的時間都顯著高于GAN,更大的計算開銷也帶來了更高的圖像生成的性能,它所生成的圖像不會受限于 Gan 的模型塌縮問題,真實性和多樣性都顯著優(yōu)于GAN,所以擴散模型的上限一定是要高于GAN的。在性能允許的情況下,Diffusion質(zhì)量和多樣性方面的優(yōu)勢是非常明顯,并且應用價值應用前景更廣。但是在一些特定的場合,例如 Mobile device 這些對于性能或者計算開銷有限制的情況下,GAN仍然是一種妥協(xié)的選擇。2)Latent space 的差異:GAN是將一個 Compact latent Vector 映射到圖像,但是擴散模型是將一個和圖像分辨率一樣的 noise map 映射逐漸去噪,映射成為圖像。實踐中,擴散模型的這種 noise map對于圖像內(nèi)容的影響常常表現(xiàn)出來為比較隨機,不具有結構化的特性。但是GAN的 Compact latent code可以非常有效地去編輯圖像中的 high level 的屬性。3)生成圖像的空間的連續(xù)性:擴散模型的圖像空間較為不連續(xù),GAN的圖像空間非常連續(xù)自然,所以我們用擴散模型進行l(wèi)atent space 編輯或者視頻的編輯時候,常常出會觀察到跳變的情況。GAN表現(xiàn)比較流暢,看起來像動畫。將來如何把這兩個模型各自的優(yōu)勢互補,會是非常有趣的研究問題。
Q:大語言模型未來最看好的垂直領域?
A:文書工作替代,生產(chǎn)力提升(姚院士);智能醫(yī)療(袁洋);AI記憶增強(楊植麟);視頻和三維內(nèi)容生成(潘新鋼)
(完)