“企業(yè)認識到數(shù)據(jù)是企業(yè)有價值的資產(chǎn),不可能把我的數(shù)據(jù)分享到云上去,這是現(xiàn)在企業(yè)應用人工智能方面的通病,所以在謹慎迎接AI又在防著AI。”
2018年10月31日,中國科技開發(fā)院大數(shù)據(jù)與人工智能研究院首席科學家張世明在NEXT·AI中國龍華智能產(chǎn)業(yè)(人才)創(chuàng)新峰會上分享時表示,我們需要實時計算結果,需要減少反應時間,需要一個可靠性的系統(tǒng),并且在線和離線地運行,需要安全合規(guī)地分離。
同時,張世明認為企業(yè)覺得數(shù)據(jù)資產(chǎn)是一種有價值的資產(chǎn),所以把數(shù)據(jù)看得非常重要,而忽略了企業(yè)數(shù)據(jù)真正存在的現(xiàn)狀?,F(xiàn)在很多企業(yè)數(shù)據(jù)是混亂的,數(shù)據(jù)之間很難打通,包括一個企業(yè)內部。從這個方面,目前的數(shù)據(jù)管理、數(shù)據(jù)運營各方面都比較低效。
在他看來,智能制造是人工智能重要的落地場景之一,工業(yè)互聯(lián)網(wǎng)是未來的大趨勢,需要所有的設備、管理、流程數(shù)字化,需要在數(shù)字化基礎上把數(shù)據(jù)流通起來,需要把數(shù)據(jù)變成生活生產(chǎn)。未來人們將以協(xié)作為中心,進行多方計算,從中心化架構到分布式架構,結果是存在多融合的、去中心化的融合架構。
張世明表示,人工智能技術應用的開發(fā)過程中,重要的一件事不是做模型的開發(fā),而90%的工作是做數(shù)據(jù)的預處理。要把ET科學家放在工廠,而不是坐在實驗室,因為必須把算法與實際的應用場景緊密結合,實驗室理想環(huán)境中的算法與實際環(huán)境相應的算法是脫節(jié)的。
資本在人工智能方面做了很大投入,并且?guī)砹思夹g方面的升級和進步,但張世明認為現(xiàn)在AI的技術發(fā)展水平遠遠沒有達到想要的需求。目前AI沒有意識和物性,缺乏綜合的決策能力,這是現(xiàn)在人工智能所面臨的一個重要問題。
以下為創(chuàng)頭條整理的張世明演講實錄:
對于人工智能現(xiàn)在的發(fā)展來說,我們遠遠沒有達到我們自己想象的一個結構,特別是針對阿里云的發(fā)展、針對ET大腦的發(fā)展以及百度、騰訊這些巨頭方面在人工智能方面的大力投入以及還有很多資金特別是資本在人工智能方面的投入上做了很大的投入,并且?guī)砹思夹g方面的升級和進步,但是我們現(xiàn)在AI的技術發(fā)展水平遠遠沒有達到我們自己想要的一個需求,所以我說現(xiàn)在的AI需要涉及到方方面面的一個技術發(fā)展。
在此,我首先需要澄清一點,就是說什么叫人工智能,大家天天都在講人工智能,特別是人工智能給我們生活帶來了很大的方便,我們現(xiàn)在可以通過人臉完成自己的手機支付,特別是支付寶,我們通過刷臉把我們的現(xiàn)金花出去了,但是我們仍然沒有任何感覺。
在此,我必須澄清一點什么叫人工智能,人工智能從這個概念出來也就五六十年的時間,但是針對它的內涵來說,就是從機器模擬人類智能,這是一個很寬泛的概念,說我們也不知道這個人工智能到底能干什么,我們只是想通過機器的方式能夠模仿人類的思維方式。
這只是一個初步的定義,如何把人工智能跟現(xiàn)有的一些生活和現(xiàn)有的技術進行結合呢?特別是現(xiàn)在針對人工智能,大家談的人工智能就是說利人行動的系統(tǒng)、利人思考的系統(tǒng)以及一些理性思維的系統(tǒng),是不是能夠通過圖靈測試、是不是能夠使機器、使我們的生活機器能聽會說,能聽懂我們說的話,能夠看懂我們寫的內容,能像人一樣的學習、能像人一樣控制我們自己所有的思維方式,針對事情的變化而做出相對應的決策,所以這是語言,我們涉及很多技術方面的發(fā)展。
因為人工智能涉及計算機科學所有領域的技術,涵蓋了內容,包括自然語言處理、視覺處理等,還有現(xiàn)在一些相關最熱的自動駕駛,包括AR/VR等,所有這些人工智能所涵蓋內容的一部分,所以我們并不能把人工智能妖魔鬼怪化。現(xiàn)在的人工智能依然有很多局限性,特別是我們現(xiàn)在人工智能,特別是我們能夠人臉識別,人可以達到98%,人人可以進行的人臉識別,還有語言,我們說的每句話都可以實時翻譯成我們的文字,把中文、英文包括阿拉伯文以及日文都可以進行相應的翻譯,但是我們可以知道我們的機器只是有智商沒有情商,不能反映我們現(xiàn)在這個人的狀態(tài)而做出相應的決策,我們這個機器人只是有智能,沒有智慧。
也就是說,我們有意識,就是它沒有意識和物性,缺乏綜合的決策能力,這是我們現(xiàn)在人工智能所面臨的一個重要問題。我們的機器會計算,但是不會算計,為什么呢?人工智能系統(tǒng)可謂是有智無心,我們更沒有相應的謀略來做出相應的環(huán)境變化而做出相應有效的變化,我們的人工智能只是在專業(yè)方面做出了很有效的一些決策,而不是一個通才。我們的機器AlphaGo會下圍棋,但是我們不能在下圍棋的角度上讓它下象棋,這是一個永遠不可以做到的事情。
在人工智能方面,現(xiàn)在各個方面的發(fā)展來說,在技術進步只是在這個視覺、在語音、語言和知識圖譜方面做了一些相應的工作,應用了機器學習和一些重要的算法來改變我們傳統(tǒng)行業(yè)和我們一些傳統(tǒng)意義上AI人工智能方面的一些問題做了初步有效的發(fā)展和利用,但是與我們實際需要的人工智能還相去甚遠。
在這兒我們可以區(qū)分出兩個概念,大家都在講人工智能,大家都在講人工智能是什么樣子,實際上我們的人工智能是什么樣子,這要區(qū)分出弱人工智能和強人工智能的概念。實際上我們現(xiàn)在講的作為人工智能只是弱人工智能,我們與強人工智能還相去甚遠,甚至我們還沒有實現(xiàn),我們只是在哲學存在強人工智能,而我們現(xiàn)實生活中和現(xiàn)有的人所想象的人工智能是強人工智能,這就是為什么我們在具體的AI應用開發(fā)過程中,我們絕大部分的AI項目特別是企業(yè)AI的項目會失敗,一個失敗的重要原因是期望的不同對認識的不同,我認為我的機器做任何事情,恰恰相反我們的機器只能做局部的部分,所以人工智能任重而道遠,需要長時間的發(fā)展。
盡管我們有了ET大腦、盡管我們有了所謂的人臉識別、所謂的圖像識別包括貓臉識別各種方式的發(fā)展,但是我們還有長遠的路要走。特別是人工智能,我們的鼻祖說了這樣一句話,就是他依然不承認把人工智能和機器學習牽涉在一起,因為他否認人工智能已經(jīng)發(fā)展到現(xiàn)有的發(fā)展程度,就是人工智能遠遠沒有達到我們自己想要的需求。
人工智能是一個多學科的概念,它涉及到計算機學科方方面面,重點來說我們可以知道現(xiàn)在人工智能就是機器學習,就是自然語言處理,就是耳熟能詳?shù)纳疃葘W習。恰恰相反,我們所有這些內容只是我們人工智能范疇中的一部分,當然這個圖并不是說很完整,有可能是某一個層面來講,我們之間人工智能和機器學習以及與自然語言處理、深度學習,現(xiàn)有我們所有熟悉的人工智能算法和架構方面、各個方面所熟悉的一些關系。
我們這邊涉及到一個人工智能和人類智慧之間重要的一個不同的問題,我覺得一個最重要的問題是在我們之間一種創(chuàng)造性的問題,我們的機器可以有智能,但是它永遠不可能像人類一樣進行文學創(chuàng)作、進行達到雅致的一種翻譯,它只是把我們現(xiàn)有的人類有說過的一些內容進行相應的匹配,找到一個最相應的結果來回答你,現(xiàn)在的人工智能僅僅做到如此,而不可能做到相應的創(chuàng)造和推理。
當然,我們講了那么多的人工智能,在人工智能現(xiàn)在來講,有大數(shù)據(jù),有區(qū)塊鏈,又是云計算,又是物聯(lián)網(wǎng),又是移動互聯(lián)網(wǎng),但這些究竟有什么關系呢?我們所有講人工智能,我們永遠不可以脫離這些事物來進行單獨的講一個人工智能的事情,所以我們講的人工智能必須涉及到大數(shù)據(jù),我們一定會涉及到云計算,一定會涉及到物聯(lián)網(wǎng),我們一定會涉及到現(xiàn)有的物聯(lián)網(wǎng)。
人工智能,現(xiàn)在大家都認為我們已經(jīng)進入到人工智能時代,我們渠道智能化。我們的人工智能驅動了人類社會進入第四工業(yè)革命和第二次信息革命,特別是大數(shù)據(jù)的發(fā)展促進了我們大規(guī)模機器學習算法的一種發(fā)展。結合著區(qū)塊鏈以及人工智能促進了我們智能化應用在生活中方方面面的應用,幫助我們人類和相應的生活做了很大的便利和企業(yè)、組織管理以及各個方面業(yè)務的發(fā)展,有很大的促進作用,所以促進了我們人類進入下一個工業(yè)革命的階段。
當然講人工智能,我們不能脫離網(wǎng)絡技術的發(fā)展、不能脫離Web的發(fā)展,只有這兩部分的技術的促進才能促進人工智能的發(fā)展,因為我們需要生活中方方面面的數(shù)據(jù)來促進這臺機器如何從各個方面的數(shù)據(jù)找出自己想要的數(shù)據(jù)結果。
人工智能的應用是智能時代變革的核心力量,現(xiàn)在的人工智能在我們的生活中已經(jīng)體現(xiàn)在方方面面了,我們的手機、我們的出勤、我們不用再為了走哪條路線而做相應的像二十年前需要查各種交通路線怎么來龍華、怎么去北京,而我們現(xiàn)在只需要一個地圖,并且我們人工智能在各個行業(yè)也產(chǎn)生了重要的影響,特別是在剛才我們講的ET大腦在各個方面一些行業(yè)包括智能交通、城市各個方面都有巨大的影響,對我們的生活產(chǎn)生了很大的便利,并且提升了我們自己的生活品質。
然而,大家覺得這個工作是非常重要的一件事情,我們應該有相應的算法開發(fā),這是大眾理解人工智能一個重要的任務,恰恰相反,我們人工智能模型的開發(fā)大家認為是最重要的一件事情,而在我們實際生活中是很小的工作。因為現(xiàn)在人工智能技術應用的開發(fā)過程中,我們需要做重要的一件事情不是做模型的開發(fā),而90%的工作是做數(shù)據(jù)的預處理。這就是剛才說把ET科學家放在工廠,而不是坐在實驗室,因為我們必須把我們的算法與實際的應用場景緊密的結合,我不能把我們的算法在我們實驗室的理想環(huán)境中與我們實際的環(huán)境相應的脫節(jié)。
我們把人工智能發(fā)展很好,發(fā)展動因在哪里?我們主要在三個方面,一個是互聯(lián)網(wǎng)的發(fā)展促進了我們數(shù)據(jù)容量大量的累積,我們生活中方方面面的數(shù)據(jù),可以累積到我們的數(shù)據(jù),可以反映到生活中的方方面面,可以使我們人工智能的機器發(fā)現(xiàn)和檢索到相應我們需匹配的一些數(shù)據(jù)內容。
第二個方面就是說我們有了數(shù)據(jù),我們如何把我們的技術變成一個有效的結果,這有效的結果必須有強大的算力,機器的發(fā)展推動深度學習,深度學習推動了相應巨大模型的出現(xiàn),事實這個巨大的模型可以拓展到某一個具體問題的方向。以前在算力不足的情況下只是把算法處理相應的簡單問題,這個算法只是做簡單的事情,而隨著大數(shù)據(jù)的發(fā)展,分布式系統(tǒng)的進步使我們的算法可以運行在一個像ET大腦這樣一種環(huán)境之中,這樣才能達到人工智能應用一種可行的環(huán)境。
從數(shù)據(jù)的角度來講,我們在未來的結果會是什么樣子呢?我們毫不疑問,就是說我們的數(shù)據(jù)會進行指數(shù)級的增長,可以想象我們的數(shù)據(jù)是非常大,包括我們現(xiàn)在所有的生活、包括我們的圖書館,我們可以想象每一個圖書館的容量是非常大的,而現(xiàn)在對于我們的一個圖書館來說,只是我們現(xiàn)在一個硬盤就能保持到所有圖書館的信息。在未來的十年或者是十五年范圍之內,我們的數(shù)據(jù)會發(fā)展到什么樣的程度呢,我們可能有十倍的增長,這只是一個數(shù)據(jù),但我想象可能比這個數(shù)據(jù)更大。
我們從傳統(tǒng)的數(shù)據(jù)庫時代走進大數(shù)據(jù)時代,在大數(shù)據(jù)時代,隨著大數(shù)據(jù)的發(fā)展、人工智能的發(fā)展以及數(shù)據(jù)智能技術進一步的深化,我們知道我們未來會走一個數(shù)據(jù)智能的時代。這個方面,我們講了現(xiàn)在我們把這個數(shù)據(jù)階段分成不同的階段,到現(xiàn)在我們處在一個大數(shù)據(jù)時代,我們累積了很多數(shù)據(jù),我們數(shù)據(jù)重要特征是變化非常快,我們需要實時計算,把現(xiàn)有實時場景得出實時結果,所以我認為這是一個快速發(fā)展時代。
針對我們的算法、針對我們的系統(tǒng)提出巨大的挑戰(zhàn),我認為未來除了存儲環(huán)境的需求,我們最終的結果是需要一種智能,我們需要一種知識結果出來,而不是需要一種傳統(tǒng)數(shù)據(jù)的結果,所以未來的結果,我覺得是一種洞察數(shù)據(jù)時代的結果。未來的結果,我們覺得超過25%的,特別是2015年左右的,我們認為實時計算是一種重要的目標,95%的數(shù)據(jù)是通過互聯(lián)網(wǎng)終端特別是物聯(lián)網(wǎng)結構,因為物聯(lián)網(wǎng)結構終端數(shù)量會比現(xiàn)有的手機會多很多,我們超過25%的數(shù)據(jù)將會關注生存安全。
我們想到所有現(xiàn)在的AI給我們只帶來方便而跟我們生活沒有任何的關系,我們可以看到一些人工智能可以在疾病診斷特別是肺癌、基因監(jiān)測方面給我們帶來很大的幫助,但是真正實際生活的幫助還是微乎其微的。雖然我們的視覺、我們的語言在分析化數(shù)據(jù)方面做出很大的貢獻,但是源源不足以我們自己生活實際所需要的這種結果。
一個重要的原因是雖然我們人工智能很多落地,但在實際的開發(fā)之中、協(xié)議中都是失敗的,所以很多人對人工智能產(chǎn)生了懷疑、對人工智能產(chǎn)生了疑慮,也是很多企業(yè)很關注人工智能但又怕人工智能的一個重要原因,是在于我們有企業(yè)覺得我們有數(shù)據(jù)資產(chǎn),我們的數(shù)據(jù)資產(chǎn)是一種有價值的資產(chǎn),所以我們把我們的數(shù)據(jù)看得非常重要,而忽略了企業(yè)數(shù)據(jù)真正存在的現(xiàn)狀。很簡單,現(xiàn)在很多企業(yè)數(shù)據(jù)是混亂的,數(shù)據(jù)之間是很難打通的,包括一個企業(yè)之間,大家都認為打通數(shù)據(jù)是很方便的一件事情。
恰恰相反,各個業(yè)務單元,除了現(xiàn)在數(shù)據(jù)質量特別好的,除了互聯(lián)網(wǎng)企業(yè)之外,其他所有傳統(tǒng)行業(yè)特別是智能制造想發(fā)展這些企業(yè),它的數(shù)據(jù)現(xiàn)在情況是非常糟糕。如果你想應用這個時間把我們人工智能的技術應用到傳統(tǒng)的行業(yè)來說,這個難度是非常大的,這就是為什么我們的ET大腦科學家要住到工廠,因為我們想梳理這個數(shù)據(jù)的現(xiàn)狀是什么樣子的,我們要理解它的數(shù)據(jù)是怎么樣混亂,它的原因是在哪里。從這個方面說,我們的數(shù)據(jù)管理、數(shù)據(jù)運營各方面都是比較低效的,所以我們在人工智能方面還有很長的路要走。
人工智能的發(fā)展除了數(shù)據(jù)的積累,流量需求是非常大的一個重要基礎之外,我們還有一個重要基礎就是我們的算力要足夠強。我們現(xiàn)在講算力,我們講云計算,我們講我們有城市大腦,然而結果卻不是我們需要的一些結果,實際應用過程中我們可能并不需要這些東西,我們需要融合的數(shù)據(jù)架構來進行人工智能的發(fā)展。
因為重要的問題是說企業(yè)認識到數(shù)據(jù)是企業(yè)的一個有價值的資產(chǎn),而這個資產(chǎn)我不可能把我的數(shù)據(jù)分享到云上去,這是現(xiàn)在企業(yè)應用人工智能方面的通病,就是各個擔心,也覺得這是很重要的事情,也覺得它是洪水猛獸,所以在謹慎的迎接AI又在防著AI的過程。因為我們需要一個實時計算結果,我們需要減少反應時間,我們需要一個可靠性的系統(tǒng),并且在線和離線的運行,我們需要安全合規(guī)的分離。我們需要改造現(xiàn)有的人工智能架構,未來的AI,我們覺得AI+各個行業(yè)方面的應用是我們創(chuàng)新應用的典范,這就是AI為什么跟航空結合、為什么跟工廠結合。我們AI方面的應有必須跟傳統(tǒng)行業(yè)某一個行業(yè)的應用結合在一起在于發(fā)揮到我們最佳的實際應用價值。
智能制造,我覺得是人工智能重要的落地場景之一,特別是除了現(xiàn)有比較火熱的自動駕駛以外,現(xiàn)在講到我們是工業(yè)互聯(lián)網(wǎng),而我們現(xiàn)在的工業(yè)大數(shù)據(jù),而我們現(xiàn)在所有講的大家很熟悉的AI都是在互聯(lián)網(wǎng),這是一個消費互聯(lián)網(wǎng),就是我們現(xiàn)在的人類消費互聯(lián)網(wǎng),而實際上我們工業(yè)互聯(lián)網(wǎng)是未來的大趨勢,這就是為什么需要我們所有的設備、管理、流程數(shù)字化,我們需要在數(shù)字化基礎上把數(shù)據(jù)流通起來,我們得到數(shù)據(jù)需要流通數(shù)據(jù),我們需要把數(shù)據(jù)變成生活生產(chǎn)。這是為什么智能制造特別重要的作用,就是個性化定制和智能合作的一個趨勢,這是為什么德國提工業(yè)4.0、美國提消費互聯(lián)網(wǎng)的事情。
在專用智能方面我們已經(jīng)做了很好了,在通用方面還做的不夠好,所以遠遠落后,所以現(xiàn)在有一個從專用智能到通用智能,從機器智能到人機混合,我們講人工智能只是人工+智能的結果,很多方面我們需要標配數(shù)據(jù)、需要大量的人工做相應的智能工作來指導我們企業(yè)做相應的搜索。未來的科學也是學科交叉將成為人工智能創(chuàng)新源泉,我們腦科學的發(fā)展、類腦的發(fā)展以及各個方面的分布式在傳統(tǒng)行業(yè)認知基礎、心理學方面的發(fā)展來促進我們人工智能發(fā)展的一個重要思想源泉。
深度學習驅動人工智能的發(fā)展,但是我們有其局限性。這就是說到一件事,現(xiàn)在人工智能的一些科學家們深陷深度學習的泥團而不能自拔,因為深度學習解決我們一些問題,而不是我們人工智能要解決的一個核心數(shù)據(jù)發(fā)展,這不多講了。
未來除了深度學習以外,我們需要強化學習,我們需要遷移學習,為什么呢?我們深入學習有大量的數(shù)據(jù),而針對學習來說我們并不需要很強大的數(shù)據(jù)量。未來我們將是以協(xié)作為中心,我們需要多方計算。我們是從中心化架構到分布式架構的結果,結果是存在多融合的,去中心化的融合架構。
多模態(tài)的終身學習也是我們智能增強的必經(jīng)之路,這是為什么我們需要把我們的數(shù)據(jù)分享給ET大腦、為什么把我們的數(shù)據(jù)積累到相應的AI應用,我們需要一個多次迭代的過程。未來的人工智能有效落地的一個重要路徑就是我們需要我們的人工智能專家,我們需要我們的行業(yè)專家,結合在一起才能做出一個正確的成功的人工智能的應用,這就是為什么我們的數(shù)據(jù)科學家、我們進工廠、我們要進養(yǎng)豬場、我們要進入相應企業(yè)的內部來做這樣一件事情。
當然,我給大家一個重要的問題就是人工智能在各個方面的一些應用,大家可以耳熟能詳?shù)囊恍茫▓D像識別、語音識別、自然語言處理、智能制造、自動駕駛、無人機、AR/VR等等。大家想現(xiàn)在是把人工智能妖魔鬼怪化,實際上人工智能是一個真正的增強人工智能。
您也可以關注我們的官方微信公眾號(ID:ctoutiao),給您更多好看的內容。