作為微信創(chuàng)始團(tuán)隊(duì)成員之一的李明強(qiáng)在 2014 年創(chuàng)辦了「圖普科技」,這家公司為企業(yè)用戶(hù)提供一個(gè)「圖像識(shí)別云服務(wù)」,企業(yè)可以選擇或者定制自己需要的各種圖像識(shí)別服務(wù),完成內(nèi)容審核、場(chǎng)景識(shí)別等功能。例如在視頻網(wǎng)站的「鑒黃」審核中,如果雇傭人工審核員的話,每天最多審核兩萬(wàn)張圖片,而圖普科技能為視頻網(wǎng)站節(jié)省 90% 的審核人力,鑒黃機(jī)器人單張圖片響應(yīng)時(shí)間小于 0.2s。
?
圖普科技創(chuàng)始人李明強(qiáng)是原騰訊資深項(xiàng)目經(jīng)理和 T4 的技術(shù)專(zhuān)家,跟隨張小龍一起參與了 QQ 郵箱和微信等產(chǎn)品的研發(fā),擁有 7 年的互聯(lián)網(wǎng)產(chǎn)品項(xiàng)目管理、團(tuán)隊(duì)管理、產(chǎn)品設(shè)計(jì)以及運(yùn)營(yíng)推廣經(jīng)驗(yàn)。機(jī)器之心最近對(duì)李明強(qiáng)進(jìn)行了專(zhuān)訪,以下是采訪實(shí)錄:
?
機(jī)器之心:你之前在演講中曾表示很早之前就開(kāi)始關(guān)注技術(shù),能大體講一下這個(gè)過(guò)程嗎?
?
李明強(qiáng):我很早初中的時(shí)候就開(kāi)始接觸計(jì)算機(jī)和編程。那個(gè)時(shí)候還是 Apple II,286、386(90 年代計(jì)算機(jī)型號(hào))時(shí)代,我那時(shí)就會(huì)自己去編程序,然后會(huì)看相關(guān)書(shū)籍。我有個(gè)大我 6 歲的姐姐,她當(dāng)時(shí)讀的是信息管理,但是她覺(jué)得我看的那些書(shū)她都看不懂。
?
很小的時(shí)候,我就會(huì)去看電路圖、焊電路板。那時(shí)候打電話還很貴的,而且不是每家都有電話,我就跟鄰樓兩個(gè)小朋友搞了一個(gè)無(wú)線對(duì)講機(jī),通信距離有幾十米。我們花了十幾塊錢(qián)買(mǎi)了一些零件出來(lái),然后自己去用電烙鐵去焊,自己做電路板,就把這個(gè)東西做出來(lái)了。電路板要配合收音機(jī)來(lái)使用,然后再調(diào)頻率,接收到信號(hào)再在另一邊拿收音機(jī)接收。后來(lái)我會(huì)去用匯編寫(xiě)一些黑客程序,做些接口,或者把更大的內(nèi)存調(diào)配出來(lái),等等。所以說(shuō)我對(duì)技術(shù)的興趣是很早就有了。
?
機(jī)器之心:你后來(lái)關(guān)注人工智能可能也和從小養(yǎng)成的這種對(duì)技術(shù)的熱愛(ài)和敏感度有關(guān)吧?那你是在什么時(shí)候覺(jué)得人工智能很有趣并開(kāi)始研究這個(gè)領(lǐng)域的呢?
?
李明強(qiáng):我是學(xué)技術(shù)出身的,所以很早就看好人工智能這個(gè)概念了。我們?cè)诰幊汤锩鏁?huì)或多或少用一些這樣的方法,那個(gè)時(shí)候我對(duì)人工智能的理解就是一堆很靈活的配置的參數(shù)。當(dāng)時(shí)用的是比較低維的函數(shù)去擬合,現(xiàn)在的神經(jīng)網(wǎng)路是用高維函數(shù)去擬合。
?
到了蘋(píng)果的語(yǔ)音識(shí)別系統(tǒng) Siri 剛出來(lái)的時(shí)候,我覺(jué)得這個(gè)東西很好,就去試了一下,發(fā)現(xiàn) Siri 的第一個(gè)版本有點(diǎn)不靠譜。當(dāng)時(shí)喬布斯也是想讓 Siri 做很多很牛的事情,但實(shí)際上我們不能把 Siri 當(dāng)秘書(shū)一樣使用。我發(fā)現(xiàn)它其實(shí)很傻,后來(lái)我主要想要的效果就是我要跟它說(shuō)「今天晚上 8 點(diǎn)提醒我回家吃飯」,它就按照時(shí)間提醒我。另外還要按照地點(diǎn)提醒,比如說(shuō)明天早上我離開(kāi)家的時(shí)候提醒我要帶什么東西,或者說(shuō)當(dāng)我到藥店附近的時(shí)候,提醒我買(mǎi)藥。我當(dāng)時(shí)很想有這么一個(gè)語(yǔ)音助手,但是 Siri 沒(méi)有實(shí)現(xiàn)這個(gè)功能。所以我就自己做了一個(gè),叫 VToDo,可以在安卓系統(tǒng)上運(yùn)行。在那個(gè)軟件里我還嘗試了一下人機(jī)的自然對(duì)話,那應(yīng)該是 2010 年,用的是科大訊飛的接口。
?
機(jī)器之心:當(dāng)時(shí)張小龍有沒(méi)有看到這個(gè)產(chǎn)品?他有什么評(píng)價(jià)嗎?
?
李明強(qiáng):他說(shuō)「想不到你還有沖動(dòng)去做這類(lèi)東西的產(chǎn)品經(jīng)理啊?!顾€是從產(chǎn)品的角度去分析了一下,當(dāng)然其實(shí)我也是從產(chǎn)品這個(gè)角度上去思考這個(gè)東西。因?yàn)槲沂菑奈业男枨蟪霭l(fā),再在里面加入了一些智能化的功能,主要是為了滿(mǎn)足我自己的需求——手機(jī)上打字太麻煩了。比如說(shuō)每周一、周二、周三、周五要提醒做什么事情的話,需要去用界面來(lái)去選擇,要做這個(gè)選擇的話,可能要點(diǎn)個(gè)十幾步。所以我就基于自己的需求引入了語(yǔ)音識(shí)別的功能。張小龍對(duì)這個(gè)產(chǎn)品挺感興趣,但他說(shuō)這個(gè)太危險(xiǎn)了。因?yàn)槲恢锰嵝褧r(shí)需要隨時(shí)都訊問(wèn)地點(diǎn),而且當(dāng)時(shí)在 iOS 上做不到這一點(diǎn),因?yàn)楫?dāng)時(shí) iOS 還不對(duì)非官方的 app 都開(kāi)放位置信息。他覺(jué)得這個(gè)東西太危險(xiǎn)的另外一個(gè)原因就是考慮到用戶(hù)隱私,它隨時(shí)都需要用戶(hù)位置共享。后來(lái)張小龍后在做那個(gè)著名的 8 小時(shí)分享時(shí)提過(guò),我們有個(gè)叫小強(qiáng)的同事做了個(gè)語(yǔ)音助手,微信下一個(gè)版本也會(huì)有這樣的功能。
?
機(jī)器之心:你從 QQ 郵箱開(kāi)始就跟隨張小龍,你覺(jué)得從他身上獲得的最大收獲是什么?
?
李明強(qiáng):小龍對(duì)我影響很大,但很多年潛移默化的,一時(shí)很難說(shuō)最大的影響是什么。比如「抓住核心需求」、「事情要往簡(jiǎn)單去做」,還有著名的那句「我所說(shuō)的東西都是錯(cuò)的」,這其實(shí)說(shuō)明一個(gè)很重要的問(wèn)題,就是要有一個(gè)開(kāi)放的心態(tài),一個(gè)念頭出來(lái)要反復(fù)的去打磨。去掉技術(shù)等一切因素,要反問(wèn)一句「這個(gè)產(chǎn)品一定要這么做嗎?」其實(shí)人工智能領(lǐng)域也很需要這種理念。
?
機(jī)器之心:是不是在這之后就開(kāi)始了人工智能方面的創(chuàng)業(yè)?
?
李明強(qiáng):2012 年年底離開(kāi)廣研,一開(kāi)始做的不是 ToB 的「圖像識(shí)別云服務(wù)」,但也是圖像識(shí)別這方面的東西,當(dāng)時(shí)一開(kāi)始出來(lái)做是做一個(gè) ToC 面向消費(fèi)者的 app,叫「最美搜衣」,就是對(duì)衣服進(jìn)行拍照搜索,或者是根據(jù)這個(gè)衣服的紋理上的特征進(jìn)行識(shí)別并實(shí)現(xiàn)導(dǎo)購(gòu),因?yàn)橐路锩嬗泻芏嗵卣魇菦](méi)法用文字很好表達(dá)的,比如說(shuō)它的顏色、紋理和風(fēng)格等。我們采集它的信息,然后根據(jù)用戶(hù)的訪問(wèn)習(xí)慣來(lái)推送這個(gè)相關(guān)的信息,有點(diǎn)類(lèi)似于垂直領(lǐng)域的今日頭條。同樣是信息的泛濫和擴(kuò)展,以及需求的不明確,但是買(mǎi)衣服還需要相關(guān)的搭配推薦。
但后來(lái)我們發(fā)現(xiàn)這個(gè)事情沒(méi)法做起來(lái),因?yàn)榕速I(mǎi)東西跟獲取資訊還是很不一樣的,那么微妙的東西人工智能還模擬不了,而且對(duì)用戶(hù)了解的數(shù)據(jù)量也不夠。
?
之后就做了圖普科技,但一開(kāi)始我們還是在原來(lái)「最美搜衣」的基礎(chǔ)上繼續(xù)做,依然不是很順利。后來(lái)出現(xiàn)了快播被關(guān)停事件,這個(gè)事情對(duì)我們有了一些啟發(fā)。我發(fā)現(xiàn),我們積累的那些技術(shù)用來(lái)做這類(lèi)事情其實(shí)挺簡(jiǎn)單的,也就是對(duì)事情進(jìn)行判斷——哪些是對(duì)的,哪些是錯(cuò)的。例如在一段視頻里哪些是色情的,哪些不是色情的,(相對(duì)于推薦衣服)這個(gè)需求是很明確的。后來(lái)我們就試了一下,發(fā)現(xiàn)效果不錯(cuò)。然后我就迅雷去談,他們之前試過(guò)很多家,但效果都不好。他們?cè)谠囘^(guò)我們的產(chǎn)品之后,發(fā)現(xiàn)雖然和他們的需求還是有點(diǎn)差距,但已經(jīng)遠(yuǎn)遠(yuǎn)好過(guò)之前的那些產(chǎn)品。快播事件也使他們對(duì)內(nèi)容審核相當(dāng)重視起來(lái),所以他們就要求我們趕快改進(jìn)產(chǎn)品。我們當(dāng)時(shí)解決這個(gè)問(wèn)題是有條主線的,想循序漸進(jìn)的去做好。迅雷有上百人的審核團(tuán)隊(duì),我們一開(kāi)始告訴他們能幫你省掉 50 個(gè)人。人工智能的好處在于可以迅速的幫你完成工作的一半,但你不知道是哪一半。所以我們告訴他們會(huì)先完成 50%,并告訴他們是哪 50%,然后再通過(guò)迭代去逐步完善。我們當(dāng)時(shí)就是以這種方式來(lái)提供服務(wù),也是這種方式來(lái)定價(jià)。在迅雷之后,我們就陸續(xù)簽了其他客戶(hù),包括酷狗的直播平臺(tái)、今日頭條、唱吧、秒拍等。隨著這些企業(yè)用戶(hù)的接入,我們自己的數(shù)據(jù)量也在不斷增加,現(xiàn)在每天處理大約 9 億多張圖片,現(xiàn)在應(yīng)該是國(guó)內(nèi)最大的圖像識(shí)別云服務(wù)提供商。
?
機(jī)器之心:現(xiàn)在圖普科技在「鑒黃」的應(yīng)用上有沒(méi)有得到用戶(hù)的一些反饋或者統(tǒng)計(jì)?比如說(shuō)節(jié)省了多少的人力,或者帶來(lái)了多少效率的提升?
?
李明強(qiáng):我們每天處理上億張的圖片,在這里如果是需要人審核的話,那你就算一個(gè)人一天看 10 萬(wàn)張圖片,一個(gè)小時(shí)最多看 5000 張。因?yàn)橐惶焓前巳f(wàn)六千四百秒,相當(dāng)于他一秒鐘看一張,而且不吃不睡覺(jué)。而且還要考慮錯(cuò)誤率的問(wèn)題。我們現(xiàn)在每天處理 9 億張圖片,那就是相當(dāng)于人力需要 18000 個(gè)小時(shí),這就對(duì)企業(yè)的人力成本有很大的減少了。對(duì)于視頻,我們是按照截圖來(lái)審核的。如果是人工審核的話,大概一個(gè)地方需要看一分鐘,但我們的算法可以快速掃描截圖。
?
機(jī)器之心:大約是在 2011 年出現(xiàn)了很多做圖像識(shí)別公司,那時(shí)大家好像有一個(gè)共同目標(biāo),就是做一個(gè)通用的云服務(wù)平臺(tái),但最后都沒(méi)有做起來(lái),所以他們之后又轉(zhuǎn)向了細(xì)分領(lǐng)域。這是不是表明,對(duì)于圖像識(shí)別創(chuàng)業(yè)公司來(lái)說(shuō),非常需求找到一個(gè)像「鑒黃」這樣的點(diǎn)來(lái)切入?
?
李明強(qiáng):對(duì),我們要考慮的是,客戶(hù)用他們的云服務(wù)到底來(lái)解決哪些切實(shí)問(wèn)題?我覺(jué)得這就像人的馬斯洛需求層次理論一樣,先讓他吃飽飯,先保證他安全,解決生存這種問(wèn)題,再往上看他有什么精神需要。我們的這些互聯(lián)網(wǎng)企業(yè)的客戶(hù)其實(shí)也是一樣的,不管是視頻,直播,還是社交,他們的基礎(chǔ)的需求就是圖像審核,而這個(gè)又需要耗費(fèi)很大的人力成本,我們就是幫他們解決這個(gè)問(wèn)題。
?
機(jī)器之心:你當(dāng)時(shí)能夠非常敏感地發(fā)現(xiàn)這樣一個(gè)非常有潛力的市場(chǎng),以及你能看到它的每一次產(chǎn)品迭代,是不是和你之前做產(chǎn)品經(jīng)理有密切關(guān)系?其他有些圖像識(shí)別創(chuàng)業(yè)公司是不是缺少了這樣一種產(chǎn)品思維?
?
李明強(qiáng):我覺(jué)得是的,有些公司是從技術(shù)層面出發(fā),盯著參數(shù)去優(yōu)化。就像我們很多做技術(shù)的人,很喜歡去做優(yōu)化,但如果說(shuō)用戶(hù)不需要,優(yōu)化再多也沒(méi)用,所以你需要考慮用戶(hù)到底需要什么。我們?cè)谧霎a(chǎn)品時(shí)也經(jīng)常受到這種挑戰(zhàn),產(chǎn)品經(jīng)理首先要去假設(shè)這個(gè)產(chǎn)品是滿(mǎn)足一個(gè)什么需求,然后大家對(duì)這個(gè)需求點(diǎn)推理一下,符合人性并且有創(chuàng)新的那個(gè)想法就會(huì)被采納,然后就推出第一個(gè)版本去試一下。一個(gè)好的產(chǎn)品經(jīng)理能夠做到 10 個(gè)里面有 1 個(gè)是符合要求就非常不錯(cuò)。張小龍也是這樣的,只是說(shuō)他成功的概率更大,抓到的核心很多。
?
機(jī)器之心:圖普科技在應(yīng)用方面找到了一個(gè)非常好的切入點(diǎn),那能介紹一下公司的研究思路?
?
李明強(qiáng):我們很早就開(kāi)始用深度學(xué)習(xí)了,2012 年深度學(xué)習(xí)用于 ImageNet 之后,我們就開(kāi)始了這方面的研究。目前我們的部分框架是基于開(kāi)源的,但我們做了很多改動(dòng),因?yàn)槲覀円龅氖蔷哂泄δ艿漠a(chǎn)品。其實(shí)我們自己有一些更好的算法,但我們都沒(méi)有采用,因?yàn)樵诔杀旧线@不一定是合適的,而且可能會(huì)太慢。用戶(hù)需要往往是性?xún)r(jià)比,我們不是學(xué)術(shù)機(jī)構(gòu),不用去研究那些最前沿的技術(shù),所以我們使用的是比較成熟的東西。
?
對(duì)于比較前沿的研究,我們會(huì)選擇和高校實(shí)驗(yàn)室合作。但作為公司的話,覺(jué)得更大的價(jià)值應(yīng)該是迅速滿(mǎn)足消費(fèi)者的需求。做研究并不是我們擅長(zhǎng)的,我們的價(jià)值在于把科研成果商業(yè)化,滿(mǎn)足現(xiàn)有互聯(lián)網(wǎng)企業(yè)的需求。
?
機(jī)器之心:圖普科技在圖片審核方面做的特別好,除此之外還提供哪些圖像識(shí)別服務(wù)?
?
李明強(qiáng):圖片審核會(huì)帶來(lái)其他一些相關(guān)的圖像識(shí)別應(yīng)用,比如說(shuō)場(chǎng)景識(shí)別、人物識(shí)別等。視頻網(wǎng)站除了需要我們的接口鑒別色情視頻外,還要去其他視頻分析發(fā)生在什么地方、里面有什么人。其他的圖像識(shí)別應(yīng)用我們稱(chēng)之為圖像增值,是相對(duì)于圖片審核來(lái)說(shuō),審核是幫助企業(yè)省成本,而圖片增值是直接幫企業(yè)產(chǎn)生價(jià)值的服務(wù),比如說(shuō)通過(guò)圖像識(shí)別提升產(chǎn)品體驗(yàn),或者根據(jù)圖像識(shí)別出來(lái)的內(nèi)容進(jìn)行精準(zhǔn)地投放廣告,等等。
?
機(jī)器之心:圖普科技未來(lái)是不是想做一個(gè)圖像識(shí)別的技術(shù)服務(wù)平臺(tái)?
?
李明強(qiáng):是這樣的,創(chuàng)業(yè)公司其實(shí)是缺數(shù)據(jù)的,所以很多人說(shuō)人工智能是大公司才有可能做的,因?yàn)樗麄兒芏鄶?shù)據(jù),是它的硬盤(pán)里真真實(shí)實(shí)儲(chǔ)存著的數(shù)據(jù)。但是很多大公司不是缺數(shù)據(jù),而是缺對(duì)數(shù)據(jù)的管理和利用。而我們做的就是管理和應(yīng)用的這個(gè)過(guò)程,市場(chǎng)需要一個(gè)專(zhuān)業(yè)的團(tuán)隊(duì)像我們這樣不斷的梳理數(shù)據(jù)。不梳理的話,不管多少數(shù)據(jù)都不是財(cái)富。而在圖像識(shí)別領(lǐng)域,你需要不斷地利用數(shù)據(jù)去訓(xùn)練算法,去迭代。我覺(jué)得我們經(jīng)過(guò)這么長(zhǎng)時(shí)間的積累和梳理,在數(shù)據(jù)這方面已經(jīng)沒(méi)有什么問(wèn)題了,這就是我們做企業(yè)服務(wù)的一個(gè)優(yōu)勢(shì)。
?
機(jī)器之心:圖像識(shí)別是一個(gè)非常通用的領(lǐng)域,比如拿人類(lèi)來(lái)類(lèi)比的話,我們有 80% 的信息都是通過(guò)視覺(jué)來(lái)接收的。你覺(jué)得接下來(lái),是不是任何一個(gè)行業(yè)都會(huì)和圖像識(shí)別、計(jì)算機(jī)視覺(jué)產(chǎn)生關(guān)系?
?
李明強(qiáng):會(huì)的,機(jī)器人也需要去睜開(kāi)眼睛去看世界并且和外部世界交互。所有的這些行業(yè)都需要圖像識(shí)別,例如工業(yè)檢測(cè)上,而且現(xiàn)在有一些機(jī)器人公司或者做智能機(jī)器的公司就會(huì)用到我們的圖像識(shí)別技術(shù)。
?
機(jī)器之心:現(xiàn)在人工智能越來(lái)越熱,外界討論也比較多,你對(duì)這個(gè)領(lǐng)域研究了很長(zhǎng)時(shí)間,也在這方面創(chuàng)業(yè),你對(duì)這個(gè)行業(yè)有什么看法?
?
李明強(qiáng):人工智能不像其他行業(yè)和技術(shù),其他行業(yè)是從需求出發(fā),但人工智能是自上而下的,最初設(shè)定了一個(gè)高高在上的技術(shù)目標(biāo),可以來(lái)解決所有問(wèn)題,然后再降下來(lái),所以它自誕生之日起就會(huì)伴隨著泡沫。所以,整個(gè)業(yè)內(nèi)還是要靜下心來(lái)考慮一下,怎么落地和產(chǎn)品化,怎么滿(mǎn)足用戶(hù)需求。
??
@本文原創(chuàng):機(jī)器之心,轉(zhuǎn)載請(qǐng)注明。