最近OpenAI推出的ChatGPT在短短幾天內(nèi)爆火全球,一時(shí)間幾乎成了各種媒體競相關(guān)注的話題。一開始好奇人們僅僅用常規(guī)問題測試這個(gè)互聯(lián)網(wǎng)應(yīng)用,由于拿到的生成結(jié)果相比于以往的AI對話應(yīng)用出現(xiàn)了質(zhì)的飛躍,于是更多人們用更加大膽的方式來使用ChatGPT,比如:讓ChatGPT幫助寫個(gè)短視頻的拍攝劇本,幫助做個(gè)酒店裝修的策劃案,甚至開始用ChatGPT作為Unity 3D編輯器的輸入端做簡單的3D應(yīng)用設(shè)計(jì)。于是,無論是科技圈、金融圈還普通人都開始興奮于技術(shù)帶來的變化。然而,在我看來,有更多的問題從腦際不斷涌向,一起來思考下這些問題?
ChatGPT這么火有什么用,AI這個(gè)話題炒了這么多年,但是生活依舊啊?
我們之所以沒有覺得AI并沒有改變多少生活,是我們以往對于新技術(shù)的理解都是聚焦在具體且有形的對象上,比如:我們對新能源帶來的變化體會(huì)深刻,是因?yàn)槲覀兘?jīng)常會(huì)看到成片的光伏發(fā)電站、風(fēng)車陣以及滿大街的新能源汽車。但是,AI技術(shù)帶來的都是潤物細(xì)無聲的巨大改變,實(shí)際上我們每天都在使用AI,甚至我們每天的衣食住行都無法離開AI。比如:從你每天打開手機(jī)起,手機(jī)中的主流應(yīng)用都會(huì)使用大量的AI調(diào)用來幫助你。當(dāng)你打開購物軟件,系統(tǒng)會(huì)使用推薦算法給你推薦你最可能買的商品,使用導(dǎo)航軟件時(shí),后臺(tái)會(huì)通過預(yù)測算法幫你規(guī)劃出最優(yōu)路徑,語音播報(bào)則采用了語音合成技術(shù)讓聲音更加自然如人聲。即便你不使用手機(jī),生活中的AI也是無處不在,停車場會(huì)通過OCR識(shí)別你的車牌,醫(yī)院會(huì)使用圖像識(shí)別來幫助醫(yī)生輔助診斷,還有大家經(jīng)常用到的自動(dòng)駕駛等等。在過去的數(shù)年里,AI已經(jīng)滲透到了各行各業(yè)的方方面面,而且還將繼續(xù)加速滲透。我們的生產(chǎn),生活,工作其實(shí)已經(jīng)離不開AI,而這次ChatGPT的爆火,將標(biāo)志著AI更加深刻的改變我們的工作,學(xué)習(xí)和生活,甚至堪比20世紀(jì)末的互聯(lián)網(wǎng)技術(shù)革命。
ChatGPT會(huì)帶來哪些改變?相比于數(shù)年前AI帶來的變化有何不同?
在回答這個(gè)問題之前,我們首先來看ChatGPT是什么?ChatGPT本質(zhì)是基于NLP(自然語言處理)大模型的對話機(jī)器人程序。這個(gè)對話機(jī)器人程序跟我們以往用過的微軟小冰,小米,小度有什么不同呢?不同點(diǎn)就在于對話機(jī)器人智能上有了巨大超越已經(jīng)十分接近甚至某些方面已經(jīng)超越了人類單體的智能。而智能上這次超越,則可能對人類社會(huì)帶來巨大的沖擊和挑戰(zhàn)。我們的生活,學(xué)習(xí)和工作會(huì)變得大不相同。ChatGPT帶來的技術(shù)突破相比于前幾年流行的AI技術(shù)革新:計(jì)算機(jī)視覺(CV)、光學(xué)字符識(shí)別(OCR)、語音識(shí)別(ASR)、語音合成(TTS)、增強(qiáng)學(xué)習(xí)、圖像合成、內(nèi)容推薦等等有了質(zhì)的變化。變化在哪里呢?變化在于過去這些AI模仿和替代的是人類的局部智能,而這些能力被視為對于人類而言是繁瑣且辛苦的工作。例如在幾年前:機(jī)場需要比對當(dāng)前乘機(jī)旅客是否是購票者,各種重要的會(huì)議和論壇需要進(jìn)行內(nèi)容速記和整理,因此在以往這些工作需要查票員和速記員來做,工作十分辛苦。而現(xiàn)在,這些基本都可以使用AI來做,效率非常高,人類可以去做更有創(chuàng)造力的工作,比如:做個(gè)插畫師、設(shè)計(jì)師、影視編劇或者小說家。但是,ChatGPT的出現(xiàn),則大不同了。它是沖著替代人腦的主要功能來的,也就是說它也可以做更加有創(chuàng)造性的工作,例如:它可以驅(qū)動(dòng)擴(kuò)散模型來生成插畫、驅(qū)動(dòng)各種DCC軟件來設(shè)計(jì)、編寫劇本和寫作更是拿手好戲。這個(gè)時(shí)候,人類是不是有一絲脊背發(fā)涼?
如果說,幾年的AI技術(shù)革新帶來的是簡單工作被機(jī)器替代,那未來幾年將是更多復(fù)雜工作被機(jī)器替代。而這些,則將深刻地改變我們的生活、學(xué)習(xí)和工作,并且產(chǎn)生新的社會(huì)挑戰(zhàn)。
國內(nèi)在類似ChatGPT對話智能應(yīng)用進(jìn)展如何,ChatGPT如何落地國內(nèi)呢?
首先,過去幾年國內(nèi)在AI領(lǐng)域的進(jìn)步都十分巨大,這些技術(shù)能力全球排在第一梯隊(duì)、與美國相當(dāng)。然而,相比于成熟的AI技術(shù),如:計(jì)算機(jī)視覺(CV)、光學(xué)字符識(shí)別(OCR)、語音識(shí)別(ASR)、語音合成(TTS)、增強(qiáng)學(xué)習(xí)、圖像合成、內(nèi)容推薦等等我們已經(jīng)沒有技術(shù)差距,我們的AI科學(xué)家和工程師可以獨(dú)立設(shè)計(jì)網(wǎng)絡(luò)模型和算法;在NLP技術(shù)上,依然存在差距,這個(gè)差距甚至大于Google,微軟與OpenAI之間的技術(shù)差距。在過去的幾年里,國內(nèi)流行的NLP模型依然是基于Google的Transformers模型和升級(jí)的Bert模型。雖然過去兩年也有國內(nèi)技術(shù)公司發(fā)布的超大規(guī)模多模態(tài)模型,而且模型參數(shù)規(guī)模都號(hào)稱超過了GPT-3模型的1750億參數(shù),但是,由于這些模型尚未以在線服務(wù)的形式供公眾測試,因此不能判斷與ChatGPT之間的差距。但是,還可以從另一個(gè)角度來判斷,就是模型訓(xùn)練的計(jì)算規(guī)模,GPT-3的訓(xùn)練計(jì)算量,相當(dāng)于1024片最新GPU芯片并行訓(xùn)練30天,到目前為止,國內(nèi)尚無哪家公司宣稱使用過此規(guī)模或者比這個(gè)更大的AI訓(xùn)練集群。由此判斷,國內(nèi)依然有差距,參考過去在成熟AI上的追趕速度,再考慮到國內(nèi)研發(fā)能力的提升,差距應(yīng)該是1-2年左右。也就是說,我們可能在2024到2025年實(shí)現(xiàn)與現(xiàn)在ChatGPT相當(dāng)或更好的NLP能力。
關(guān)于ChatGPT如何在國內(nèi)落地,首先要看ChatGPT在美國的落地形式。ChatGPT在美國是以Web應(yīng)用和標(biāo)準(zhǔn)API的方式提供服務(wù),并且是基于云服務(wù)的形式部署。之所以基于云服務(wù),主要是因?yàn)槟P蜆O其龐大且用戶眾多,所需計(jì)算資源只能基于云端無限的計(jì)算能力。換個(gè)角度說,用戶要使用ChatGPT就要把所有數(shù)據(jù)需要提供給ChatGPT的數(shù)據(jù)中心。因此,基于眾所周知的原因,國內(nèi)不大可能允許開放使用ChatGPT,而對方國家也不可能將如此龐大的模型數(shù)據(jù)和高科技軟件放在中國部署。最可能的方式是中國公司開發(fā)自己的類ChatGPT應(yīng)用,正好也在數(shù)天前,國內(nèi)知名互聯(lián)網(wǎng)公司某度宣布了要開發(fā)類似的聊天機(jī)器人。除了某度,國內(nèi)還有幾家互聯(lián)網(wǎng)科技公司具備這樣的實(shí)力,也許在這波熱度的帶動(dòng)下,國內(nèi)的NLP會(huì)迎來突破,我們拭目以待。
普通人如何與ChatGPT相處呢?
這本質(zhì)不是與ChatGPT相處,而是與ChatGPT這樣類型的AI技術(shù)相處。首先,我們在前面已經(jīng)論述過了,ChatGPT這樣的AI本質(zhì)上是對人腦功能的模擬和替代,對于社會(huì)的影響可以從積極和消極兩個(gè)方面來看。首先是看積極的方面,由于ChatGPT的加持,使得諸多專業(yè)能力可以通過ChatGPT這樣的AI所補(bǔ)足,普通人也可以逾越這些專業(yè)能力的束縛,發(fā)揮想象力來產(chǎn)生超越人+機(jī)器智能的能力。這就如同普通人使用手機(jī)+傻瓜化短視頻剪輯工具也可以拍出來以往只有專業(yè)人士才能拍出的視頻一樣。這會(huì)極大地降低許多工作的專業(yè)門檻,充分解放大家的創(chuàng)造力。但是,也將帶來消極的一面。而且消極的一面帶來的問題更多,其一是許多與語言相關(guān)的崗位將被ChatGPT替代,諸多的白領(lǐng)崗位將消失,這其中也將包括程序員(程序員是計(jì)算機(jī)語言使用者),取而代之的是需要少量精英程序員即可,其他工作則由ChatGPT來補(bǔ)足。其二是由于ChatGPT帶來的低成本創(chuàng)作能力,使得人類極有可能被機(jī)器智能創(chuàng)造的內(nèi)容淹沒,能想到的辦法就是用ChatGPT對付ChatGPT,用魔法打敗魔法。但是目前并不樂觀,像當(dāng)前那些通過推薦算法提供信息流和視頻流的APP已經(jīng)實(shí)現(xiàn)通過人類創(chuàng)作的內(nèi)容來淹沒人類,我們耳熟能詳?shù)某?jí)APP幾乎都成了時(shí)間和精力的殺手。這些,可能并不能單純依靠技術(shù)或者技術(shù)廠商的自律可以解決。
講回普通人與AI的相處方式,就是把它當(dāng)做新的生產(chǎn)生活工具,基于它來發(fā)揮創(chuàng)造力,實(shí)現(xiàn)人+機(jī)器智能的能力放大。
ChatGPT是AI技術(shù)帶給人類的最大危機(jī)嗎?
來分享一張圖,也就是上圖。這張圖是我2021年6月在Bing.com上搜索到的,到今天很感嘆這張圖時(shí)間預(yù)測的精準(zhǔn)性,其實(shí)背后也有清晰的邏輯,類似的圖還有很多,背后的邏輯是人類計(jì)算成本的降低帶來的機(jī)器智能的提升。圖里其實(shí)有幾個(gè)關(guān)鍵時(shí)間點(diǎn):2015,2023,2045。2015年主要是我前面說到的普通AI技術(shù)的突破,2023年的突破猜測是ChatGPT這樣的NLP技術(shù)帶來的對于人類單體智能的超越,2045年這個(gè)時(shí)間點(diǎn)則是最大的危機(jī),也就是機(jī)器智能將超過全人類的智能。如何去理解呢?大家看過《流浪地球2》的話,可以理解成MOSS的智能,它將比人類全體的智能更強(qiáng),此時(shí)很多事情似乎將變得不由人類自己決定。
在過去的很多影視作品里,經(jīng)常遇到計(jì)算機(jī)上的AI具備意識(shí)并且出現(xiàn)失控的情況。即使不出現(xiàn)計(jì)算機(jī)上的AI系統(tǒng)擁有自我意識(shí)的情況,這樣的AI系統(tǒng)如果了控制了全人類的信息,那也是一件非常令人不安的事情。它可以控制電梯,生產(chǎn)線,紅綠燈,火車,飛機(jī),雷達(dá),塔臺(tái),自動(dòng)駕駛汽車,手術(shù)機(jī)器人,生命維持系統(tǒng),通信網(wǎng)絡(luò)等等是不是?
不過,每次技術(shù)革命,似乎大家都有很多不安,而人類總是可以逢兇化吉,期待技術(shù)進(jìn)步帶來的好處也許更為明智。
(完)
2021-12-16 電科技發(fā)布了 《羅永浩劃定重返科技界目標(biāo):AR/VR/MR,下一站元宇宙?》的文章
2021-11-17 電科技發(fā)布了 《愛奇藝2021Q3財(cái)報(bào)發(fā)布:總收入76億元 會(huì)員營收43億元》的文章
2021-11-05 電科技發(fā)布了 《將3A大作帶入大屏場景,樂播攜手天翼推出云游戲主機(jī)》的文章
2020-03-23 電科技獲得了沐晨的關(guān)注