?
直播火了,網(wǎng)紅火了,但是伴隨而來的還有各種違規(guī)內(nèi)容被暴漏在網(wǎng)絡(luò)上,近期部分直播平臺被網(wǎng)信辦高度關(guān)注,是什么原因?qū)е轮辈テ脚_的不良信息“被泄漏”?目前視頻直播的審核方式有哪些?應(yīng)該怎么看待直播的發(fā)展?雷鋒網(wǎng)旗下品牌活動“硬創(chuàng)公開課”邀請圖普科技CEO李明強(qiáng)做客線上專訪活動,和大家一起聊聊直播內(nèi)容的監(jiān)管以及機(jī)器學(xué)習(xí)應(yīng)用的那些事。以下為訪談內(nèi)容的干貨整理。
?
問題一|直播審核的現(xiàn)狀
1、直播平臺對直播內(nèi)容(圖像)的監(jiān)管存在什么困難?
第一、網(wǎng)絡(luò)直播規(guī)模龐大,人工審核成本高
2015年直播平臺接近200家,用戶數(shù)量已經(jīng)達(dá)到2億,大型直播平臺每日高峰時間會有數(shù)萬個直播“房間”同時在線,用戶數(shù)可達(dá)千萬人次,如果全部用人工對1萬路視頻同時進(jìn)行審核,為了保證“無漏網(wǎng)之魚”,至少需要數(shù)百人同時工作,并且每位工作人員需要配備1-2臺監(jiān)控設(shè)備。
比如映客現(xiàn)在在審核上投入的人力就是800多人,占據(jù)了7000平方米的審核基地,24h都需要人力在審核。其實(shí)直播視頻內(nèi)容的違規(guī)比例占比不高,僅0.04%,甚至更低,但為了做到“無漏網(wǎng)之魚”,企業(yè)需要投入大量的人力、物力和財力進(jìn)行監(jiān)管,運(yùn)營成本壓力增加。
第二:直播流量聚焦夜晚,人工審核效率低
網(wǎng)絡(luò)直播白天跟晚上的“房間數(shù)”不同,目前,白天直播流量峰值是數(shù)百路視頻,晚上可以飆升到數(shù)千路。但“三班倒”的審核人員,夜晚疲勞,人眼識別精確度降低,出現(xiàn)誤判漏判的概率上漲,審核效率降低,難以達(dá)到網(wǎng)絡(luò)直播的內(nèi)容監(jiān)管需求。
第三:主播實(shí)名及直播實(shí)時驗(yàn)證難
直播平臺注冊簡單,主播規(guī)模擴(kuò)充迅速,如果實(shí)名驗(yàn)證完全依靠人力審核,人力成本增加,難以做到真實(shí)有效的審核;再加上一些稍微大一些的直播平臺高峰期時期會有上萬人,如果每次主播直播時,都驗(yàn)證是否屬于本人在直播,這又增加一部分人力成本,對于一些中小型直播創(chuàng)業(yè)企業(yè)而言,運(yùn)營難度上升。
?
2、國家對于監(jiān)管出臺的政策,對直播平臺有什么影響?
(1)從直播平臺本身來說,能夠促進(jìn)直播平臺加強(qiáng)自律:例如部分直播平臺規(guī)定主播需實(shí)名驗(yàn)證、滿18周歲;直播內(nèi)容存儲時間不少于15天;所有直播房間內(nèi)添加水??;對于情節(jié)嚴(yán)重的主播將列入黑名單、對直播內(nèi)容進(jìn)行24小時實(shí)時監(jiān)管、要有專人負(fù)責(zé)等。
(2)從直播平臺的發(fā)展來說,對于大型企業(yè)的發(fā)展是比較有優(yōu)勢的,相當(dāng)于對直播平臺增加了一定的門檻,大型直播平臺對監(jiān)管成本上升的承受能力比較高,中小型視頻直播平臺將在監(jiān)控審查成本的提升環(huán)境下挑戰(zhàn)和壓力增大。
(3)從直播平臺的內(nèi)容來說,依靠色情、暴力等擦邊球的“激進(jìn)”內(nèi)容來吸引用戶的道路越來越不可行,未來受歡迎有潛質(zhì)的主播也許會更加偏向?qū)I(yè)化,內(nèi)容也會更加健康。
?
問題二|審核直播,機(jī)器能做什么?
1、審核直播的方式有哪些?
傳統(tǒng)的圖像審核方式主要有兩種:1、純?nèi)斯徍耍浩髽I(yè)員工“三班倒”工作;傳統(tǒng)智能審核:人眼鑒別該圖片或視頻是否違規(guī);2、傳統(tǒng)的智能審核:如識別色情圖像,基本是通過圖片RGB 值識別膚色比例;通過建模識別異常動作、敏感部位等。
但是這兩種審核方式都存在較大的漏洞,“三班倒”的人工容易導(dǎo)致審核效率低、誤判漏判多等主觀性問題;傳統(tǒng)智能識別色情圖片準(zhǔn)確率低、經(jīng)常誤報等。而且這三種審核方式對近兩年熱門的視頻直播審核需求更難以滿足。
現(xiàn)在主要是利用機(jī)器識別結(jié)合人工審核的模式進(jìn)行審核,機(jī)器識別是依賴于人工智能領(lǐng)域最新的算法:深度學(xué)習(xí)算法,通過模擬人腦神經(jīng)網(wǎng)絡(luò),構(gòu)建具有高層次表現(xiàn)力的模型,能夠?qū)Ω邚?fù)雜度數(shù)據(jù)形成良好的解讀。通過大數(shù)據(jù)持續(xù)訓(xùn)練、頻繁的迭代,不斷提高鑒黃精確度,有效節(jié)省人工復(fù)審的工作。
?
2、審核直播內(nèi)容,機(jī)器都做了什么?
(1)機(jī)器審核直播內(nèi)容是否涉黃、違法
機(jī)器主要是用來專門判斷哪些圖片是色情的或者需要被過濾掉的違法信息,它在這方面的智能程度是可以替代人力的,經(jīng)過機(jī)器審核后的數(shù)據(jù),會分為“確定”和“不確定”的兩個部分,確定部分的可以達(dá)到99.5%的準(zhǔn)確率,不確定的會誠實(shí)地告訴客戶,由客戶做出決斷。不確定的部分可能只占到審核總量的1~2%,原先需要100個人審核,經(jīng)過機(jī)器識別服務(wù),就可以只用1~2個人來完成了。
(2)機(jī)器識別的工作原理
目前機(jī)器學(xué)習(xí)的核心技術(shù)是深度學(xué)習(xí),簡單來說,可以把深度學(xué)習(xí)理解為一個空白的人腦,這些大量的數(shù)據(jù)就是灌輸進(jìn)來的經(jīng)驗(yàn)。深度學(xué)習(xí)是屬于機(jī)器學(xué)習(xí)的一個范疇,是最新的機(jī)器學(xué)習(xí)技術(shù),其最主要體現(xiàn)在“深度”這兩個字。
深度學(xué)習(xí)可以理解為“深度機(jī)器學(xué)習(xí)“,普通或者傳統(tǒng)的機(jī)器學(xué)習(xí)在神經(jīng)網(wǎng)絡(luò)的復(fù)雜度和層數(shù)沒有像現(xiàn)在的這么高,而深度學(xué)習(xí)層數(shù)和復(fù)雜度都加深了許多,因此才會叫做深度學(xué)習(xí)。
譬如說你想訓(xùn)練一只狗,狗做對了你就給它激勵,做錯了你就懲罰它,那久而久之它就知道哪些是正向、負(fù)向的激勵,然后就明白自己哪些事情是自己應(yīng)該去做的,對于錯誤的事情的想法也會逐漸被抵消。
當(dāng)我們把大量的色情、性感、正常的樣本的屬性告訴深度學(xué)習(xí)的引擎, 然后讓引擎不斷學(xué)習(xí),對他們正確的行為進(jìn)行獎勵,錯誤的行為進(jìn)行懲罰,當(dāng)然這些獎勵和懲罰都是數(shù)學(xué)上的,最后空白的腦袋就會學(xué)成了一種連接的模型,這種模型就是為了鑒別色情與非色情而生的。
?
3、那么為什么之前機(jī)器學(xué)習(xí)沒有爆發(fā),只是在這一兩年開始爆發(fā)?
因?yàn)闄C(jī)器學(xué)習(xí)需要同時滿足三個條件:
1、海量的數(shù)據(jù)(大家都知道互聯(lián)網(wǎng)發(fā)展那么多年,已經(jīng)積累了大量的數(shù)據(jù),并且數(shù)據(jù)量還在持續(xù)得上漲);
2、高性能計(jì)算的能力 (顯卡和GPU因?yàn)槟柖傻陌l(fā)展,也已經(jīng)有了一定的基礎(chǔ));
3、深度學(xué)習(xí)的算法(在2012年被一次ImageNet的比賽,被業(yè)界廣泛注意到,隆重的登上了歷史的舞臺)
?
4、直播(圖片/幀)數(shù)量那么多,你們(圖普)能為他們做什么?
?
1)目前做圖像識別的有哪些公司,你們的競爭差異在哪里?
1、智能審核垂直領(lǐng)域的競爭對手主要是一些比較大的企業(yè),譬如說騰訊優(yōu)圖、阿里綠網(wǎng),他們主要為自身平臺客戶提供審核服務(wù),不屬于第三方,在產(chǎn)品和技術(shù)方面,差異主要如下:
第一:服務(wù)細(xì)致程度更高,準(zhǔn)確度更高。圖普是國內(nèi)最早利用人工智能算法做審核服務(wù)的,也是在在工程經(jīng)驗(yàn)、 服務(wù)專業(yè)度方面具有先發(fā)優(yōu)勢,我們會根據(jù)不同的客戶、不同的細(xì)分領(lǐng)域,做單獨(dú)的模型調(diào)整以及算法細(xì)節(jié)的優(yōu)化,專人服務(wù)對專門的客戶做專業(yè)的運(yùn)營。圖普也是國內(nèi)利用人工智能做智能審核的首倡者,很多定價的方法、歸類的方法、接口返回的定義都為后來的同行做出了一定標(biāo)準(zhǔn)和規(guī)范。
第二:識別接口更全面。除了提供審核之外,還有包括人臉、場景、物體、車、表情、人的年齡以及服裝風(fēng)格等幾十種識別接口??蛻粢淮谓尤牒?,可以自行增減各種服務(wù)接口,只要一次接入,就可以滿足各種需求。
第三、使用更方便。客戶無需為了使用圖片識別服務(wù)而綁定任何云計(jì)算平臺,也可以通過 圖普入駐的七牛、UCloud、AWS、融云等知名平臺直接調(diào)用。
2、另外,也有一些圖像識別技術(shù)領(lǐng)域的同行:依圖、圖森、曠視科技、格靈深瞳、商湯科技等,大多數(shù)都是同為創(chuàng)業(yè)企業(yè),但是產(chǎn)品線有所差異,他們主要是面向安防監(jiān)控、金融、廣告。
?
2)你們都服務(wù)哪些直播平臺,舉些例子詳細(xì)解讀下
主要的直播平臺都是在使用我們的服務(wù):映客、花椒、在直播、繁星網(wǎng)、秀色娛樂、風(fēng)云直播、易直播、kk直播、17直播、悟空TV、么么直播等
3)具體做的服務(wù)都有哪些,如何幫忙做推薦、鑒別小黃圖、如何幫助企業(yè)規(guī)避政策限定?
目前直播服務(wù)主要分為兩種類別;
標(biāo)準(zhǔn)審核服務(wù):包括鑒黃、暴恐識別、廣告識別、敏感人臉過濾等;
個性化定制服務(wù):根據(jù)客戶的實(shí)際需求,定制專屬的圖像識別整體解決方案,譬如針對特定場景(抽煙、喝酒、打架、自殘等)的審核,人臉識別(主播顏值、風(fēng)格、表情、年齡、性別、其他外在特征等)、場景識別(主播直播時所在環(huán)境)、物體識別(直播平臺中出現(xiàn)的物體)等各種圖像的識別。
?
比如在場景的精準(zhǔn)推送上,可以基于人臉、場景、商品識別與分析技術(shù),抓取視頻內(nèi)的價值信息,實(shí)現(xiàn)最精準(zhǔn)的內(nèi)容匹配;在主播風(fēng)格推薦上,可以自動分類不同風(fēng)格的男神女神,根據(jù)用戶平臺資料和興趣,智能推送偏好類型;還可以建立顏值推薦系統(tǒng),基于人臉識別,機(jī)器自動將高顏值主播推薦給用戶等。
?
問題三|直播很火,機(jī)器學(xué)習(xí)同樣很火
?
1、除了審核直播,機(jī)器學(xué)習(xí)還能做什么?(或者你們還在做什么)
除了幫助直播平臺規(guī)避內(nèi)容風(fēng)險,機(jī)器識別還可以通過以下幾個形式優(yōu)化視頻直播平臺:
第一、通過圖像識別對主播進(jìn)行分類,可以得出直播平臺的內(nèi)容是否健康,或者給主播打上標(biāo)簽,平臺是否需要培養(yǎng)和扶持一些比較稀缺、受歡迎的主播。
第二、深挖直播平臺的圖像識別云服務(wù),例如主播正在做什么,唱歌、跳舞、抽煙、化妝、睡覺或其他。在將來全民生活直播,可以挖掘的信息量就更大,包括萬事萬物的識別,視頻內(nèi)出現(xiàn)的車、手機(jī)、玩具或其他的,這都是反映了一個人的生活習(xí)慣、行為習(xí)慣,機(jī)器可以根據(jù)用戶偏好,智能推送相應(yīng)直播視頻,幫助直播企業(yè)更好地進(jìn)行用戶互動運(yùn)營。
第三、直播的視頻內(nèi)發(fā)出的所有圖像信息,包括人物、地點(diǎn)、活動、事物、背景等,在以人工智能技術(shù)作為基本支撐下,可以幫助用戶智能搜索所需信息,像KTV、餐廳、教室等,這些都是可以提高產(chǎn)品和用戶體驗(yàn),或者企業(yè)想將這些信息流量變現(xiàn),均可按企業(yè)需求定制。
第四、基于人的智能搜索,幫助直播平臺把用戶和內(nèi)容串連起來,把相似的主播串連起來,讓用戶找出自己想要的人物形象。例如用戶可以描述自己夢中情人的形象然后進(jìn)行智能搜索,或上傳自己的照片即找出與自己最有夫妻相的主播等,這都是目前同質(zhì)化直播平臺沒有做到的事情。
?
問題四|您對機(jī)器學(xué)習(xí)的未來趨勢怎么看?
大家從圖像讀出來的信息,同樣的,圖像識別機(jī)器都可以將其中的信息提取出來。機(jī)器學(xué)習(xí)在圖像和視頻上,就是做了替代了人工回答或者描述一張圖片或視頻的所有信息的這些事情。
另外,圖像搜索也是一種圖像識別的應(yīng)用,比如在視頻網(wǎng)站上、在直播上找到跟自己相似、有夫妻相的人等做一些好玩的應(yīng)用;“正經(jīng)兒”的應(yīng)用也有,比如說浙江輕紡城的電商城中對于布匹的搜索。
互聯(lián)網(wǎng)的本質(zhì)就是兩個字“連接” ,而連接就是需要對內(nèi)容的識別后才可以進(jìn)行的,如果不對內(nèi)容進(jìn)行理解,連接的是關(guān)于什么內(nèi)容是不知道的,或者說發(fā)了同樣內(nèi)容的兩個人,他們的興趣愛好本應(yīng)是連接起來的也沒有被連接。所以在互聯(lián)網(wǎng)進(jìn)到視頻和直播的時代之后,對于內(nèi)容的連接應(yīng)該變得更加重要。
并且在線下領(lǐng)域,比如說機(jī)器人、智能家居、智能工業(yè)制造等各個領(lǐng)域,都會需要圖像識別和理解,它們就像機(jī)器人的眼睛一樣收集外界的信息。比如:
1、生活上,智能電視,如果電視識別到是你在電視前面觀看,就會自動跳轉(zhuǎn)到球賽;如果是你媽媽在觀看,就會自動調(diào)到家庭電視??;智能服務(wù)機(jī)器人,看到你向他招手,他就會越過障礙向你走過來,會說“先生好,有什么可以幫到你?”你指著菜單跟他說你要某一個之后他就會自動給你下單,然后把菜給你端上來等;
2、商業(yè)應(yīng)用上,一個電影院想統(tǒng)計(jì)看電影的人的性別、年齡、穿著打扮做用戶畫像或者通過看電影時的表情觀察用戶對電影的評價等都可以通過圖像識別來獲得分析;
安防和監(jiān)控領(lǐng)域,除了抓獲犯人和違規(guī)車輛外,還有企業(yè)內(nèi)部的大客戶管理方面的需求等;
3、智能工業(yè)制造上,在生產(chǎn)線上,是有1/3的工人是在質(zhì)檢相關(guān)的事情,而不是制造相關(guān)的事情,這部分質(zhì)量檢測就像是互聯(lián)網(wǎng)的鑒黃一樣,都是對生產(chǎn)內(nèi)容的把關(guān)和檢測,也是可以被替代的等。
所以一旦展開,其實(shí)大家可以想象到有很多人工智能、圖像識別或者視頻識別的應(yīng)用,就像“互聯(lián)網(wǎng)+”一樣,人工智能也會滲透各個領(lǐng)域中,形成“人工智能+”的發(fā)展模式。
人工智能不是小部分人壟斷在一個平臺、一個引擎,每個人都可以在自己的行業(yè)和領(lǐng)域發(fā)散思維,自己做的哪些事情可以通過人工智能來提高效率、建立先前沒有的交互體驗(yàn)、降低成本等。
如果讓大家坐時光機(jī)跳到五年之后,也許大家會突然感到每一件東西都有一點(diǎn)臨近一樣,五到十年之后,大家可能會處在一個被人工智能包圍的世界里,比如說可能會有人工智能為你開車、為你打掃衛(wèi)生,打開手機(jī)會有人工智能為你推薦新聞,會有人工智能為你管理健康、日程、衣食住行等各個方面。
雖然短時間內(nèi),人工智能還無法人類的情感之類的復(fù)雜、深刻或微妙的東西,但是五到十年之后,一定會出現(xiàn)大量的在垂直領(lǐng)域相對成熟的人工智能企業(yè),會讓大家用上很多相對成熟的人工智能應(yīng)用,會有很多的行業(yè)發(fā)生巨大的改變,讓我們一起迎接人工智能的時代。
?
?
您也可以關(guān)注我們的官方微信公眾號(ID:ctoutiao),給您更多好看的內(nèi)容。