【辯論角色及觀點】
從左至右
王濤(主持人,愛奇藝首席科學(xué)家):視頻大數(shù)據(jù)助力影視、動漫、游戲行業(yè),云服務(wù)終將實現(xiàn)
王井東(微軟亞洲研究院主管研究員):數(shù)據(jù)庫的建設(shè)、標(biāo)注與數(shù)據(jù)聯(lián)盟的建立十分必要
侯宇濤(英偉達CUDA應(yīng)用市場總監(jiān)):GPU和高性能硬件加速深度學(xué)習(xí)發(fā)展
趙世范(?低暣髷(shù)據(jù)開發(fā)總監(jiān)):人臉識別尚不成熟,人臉驗證已具備實用條件
谷沉沉(騰訊微信事業(yè)群高級工程師):大數(shù)據(jù)改善用戶體驗,騰訊不靠賣數(shù)據(jù)賺錢
王田(華為研究院媒體研究室首席科學(xué)家):5G網(wǎng)絡(luò)將在2020年左右進一步聯(lián)連通世界
譚曉生(奇虎360科技副總裁):大數(shù)據(jù)開啟網(wǎng)絡(luò)安全與隱私新格局
大數(shù)據(jù)已經(jīng)很“大”,但遠(yuǎn)遠(yuǎn)無法滿足現(xiàn)實需求
王濤(主持人):最近幾年來,由于互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)的高速發(fā)展,手機、攝像機、各種傳感器數(shù)據(jù)采集的設(shè)備,并且能傳輸?shù)皆贫说臄?shù)據(jù)中心?大數(shù)據(jù)的增長非?,在未來的10年要增長八位數(shù)字,比現(xiàn)有的數(shù)據(jù)還要多8倍。諸位從自己所在行業(yè)的角度出發(fā),你們感覺到最大的需求和問題是什么?大家是如何看待大數(shù)據(jù)時代的機會與挑戰(zhàn)的?
譚曉生:我在360主要負(fù)責(zé)大數(shù)據(jù)計算和信息安全。2010年,360做了一個基于大數(shù)據(jù)惡意文件的鑒別引擎——QVM,今年第一季度QVM在全球一次評測中與卡巴斯基全球并列第一,滿分。我們的做法就是基于80億的大數(shù)據(jù)樣本,顛覆了過去特征碼利用掃描的方法。除此之外,在兩年多之前,我們開始做基于網(wǎng)絡(luò)的全流量的監(jiān)聽的供給檢測,采用了有監(jiān)控的學(xué)習(xí)方法,現(xiàn)在進入到了無監(jiān)督的學(xué)習(xí)階段,最基本的成果就是幫助國家抓住了進行API攻擊的犯罪分子。我們用大數(shù)據(jù)的方法在這方面取得了非常豐碩的果實。我們知道大數(shù)據(jù)技術(shù)的效果很好,存儲也已經(jīng)非常強了,但是怎么樣去做更大規(guī)模的數(shù)據(jù)計算呢?這是我現(xiàn)在覺得非常值得關(guān)注的一個點。
王田:在大數(shù)據(jù)方面,華為主要提供通訊設(shè)備和網(wǎng)絡(luò)服務(wù)。網(wǎng)絡(luò)在將來一定會比現(xiàn)在好,會有更高的要求,但具體是什么?比如說對連接數(shù)有什么要求?網(wǎng)絡(luò)響應(yīng)有什么要求?帶寬需要有什么樣的要求?我們的通信實驗室會根據(jù)不同指標(biāo)和情景做大數(shù)據(jù)研究。我們考慮更多的是網(wǎng)絡(luò)的關(guān)系,未來大數(shù)據(jù)里面網(wǎng)絡(luò)到底應(yīng)該起到什么樣的作用?2020年網(wǎng)絡(luò)可能是5G,5G業(yè)務(wù)對網(wǎng)絡(luò)有一個更高的要求,不僅是帶寬還有延遲,還有一些年際數(shù)。
谷沉沉:我在主要工作是做微信上面的視頻分發(fā),騰訊一直在做一些海量用戶的行為的大數(shù)據(jù)搜集和分析,研究對現(xiàn)在的產(chǎn)品做哪些改進?同時還要對現(xiàn)在的產(chǎn)品質(zhì)量在海量用戶中做一個評價?騰訊的用戶量非常龐大,微信現(xiàn)在有5億用戶,視頻通話產(chǎn)品的日發(fā)起量也是千萬起,這樣一個海量用戶的產(chǎn)品,如何讓更多的用戶對我們的服務(wù)感到滿意?就現(xiàn)在來看,無論我們怎么努力,每天我們?nèi)タ从脩舴答,總是有用戶在罵我們的產(chǎn)品,說視頻通話不清晰、不流暢,現(xiàn)在也在做這一些的嘗試,搜集大量豐富的數(shù)據(jù),針對一些用戶細(xì)分場景,比如中國網(wǎng)民是4G網(wǎng)絡(luò)還是2G、是20兆帶寬還是2兆帶寬?這樣網(wǎng)絡(luò)的差異和手機性能差異都影響著產(chǎn)品的體驗度。
趙世范:海康威視在今年成立了研究院,主要有兩部分:智能視頻和大數(shù)據(jù)。大數(shù)據(jù)組的主要工作,是將智能視頻識別以后的對象進行分析,比較成熟的是車牌識別記錄下的車輛過車信息。目前的主要工作是協(xié)助公安系統(tǒng)做一些案件的偵破,之后也會做一些城市交通疏導(dǎo)方面的工作。?低曇庾R到,視頻監(jiān)控的車牌識別還是一個比較成熟的應(yīng)用,有一些過車記錄數(shù)據(jù)產(chǎn)生;而另外一方面,針對場景的視頻識別,還有一些基于人的視頻識別,技術(shù)難度較大,是我們現(xiàn)在需要解決的問題,比如:第一個,從一個場景里面把人提取出來,同時能夠提取場景里面的一些物品;另外一個,實現(xiàn)多個場景人的關(guān)聯(lián)。
王濤(主持人):你們這個是什么級別的量體?需要知道視頻這一時刻有人、有物品?還是說需要知道這個物體、人在什么位置?是哪個人?是哪個物體?
趙世范:監(jiān)控視頻領(lǐng)域已經(jīng)從標(biāo)清到高清,但實際上高清目前也就是200萬到300萬像素,而真正能夠讓給機器達到人眼相似的識別度,像素要到1200萬左右,清晰度還需極大提升。目前視頻里對移動對象的識別是非常成熟的,可以知道這個視頻里面有什么對象?這個東西是人還是車?或者里面有多少人?但這個人和另外一個鏡頭里面的人是不是同一個人?目前在判斷上是非常困難的。計算機對人臉的識別技術(shù)有一定的發(fā)展,特別是在深度學(xué)習(xí)應(yīng)用以后,在互聯(lián)網(wǎng)應(yīng)用中有一些突破,但跟安防領(lǐng)域比還是有很大差異。第一個,它的色彩度不太好;第二個,它有很多的形變;第三個,受清晰度和光照等因素影響,會變模糊。判斷是不是同一個對象現(xiàn)在非常困難。
侯宇濤:英偉達作為大數(shù)據(jù)產(chǎn)業(yè)鏈里面的技術(shù)以及相關(guān)支撐產(chǎn)品的供應(yīng)商,致力于能夠降低大數(shù)據(jù)計算及處理的計算時間。我們目前面臨的最大壓力是來自于客戶的期望,而且GPU可以加速變形計算的處理,目前加速的速度相對以前已經(jīng)很高。香港大學(xué)的兩位老師以前在做人臉識別的計算,一個簡單追蹤的過程需要20天,用了GPU以后,由20天變成了6小時,有很大的提升。他說,你能不能再快一點?80倍的提升仍遠(yuǎn)遠(yuǎn)達不到大型數(shù)據(jù)采樣的需求。英偉達力圖優(yōu)化內(nèi)存采用3D的構(gòu)架,并使單卡的內(nèi)存可以突破24G或者更高,這樣可以使更大規(guī)模的數(shù)據(jù)同時得到處理。
王井東:我在微軟的主要工作集中在大規(guī)模的相似度搜索,有一些技術(shù)應(yīng)用在微軟必應(yīng)搜索這樣的產(chǎn)品里面。現(xiàn)在已經(jīng)有大數(shù)據(jù)環(huán)境,其實直接能夠用來幫助去做研究的數(shù)據(jù)還很少。剛才余凱老師提到,大數(shù)據(jù)已經(jīng)很大,但是學(xué)術(shù)領(lǐng)域里面最大的數(shù)據(jù)比如ImageNet,也有1000類,fine-grained classes也只有22000多,在實際應(yīng)用里面還是遠(yuǎn)遠(yuǎn)不夠的。我們希望將來對大的數(shù)據(jù)都會有標(biāo)注。我總結(jié)起來就是數(shù)據(jù)問題,怎么樣能夠做到更好,更reliable(有用的)的幫助研究開發(fā)。
人臉識別尚不成熟但大有可為
王濤(主持人):剛才說人臉識別是一個很重要的發(fā)展方向。前面在特定的數(shù)據(jù)之上,達到百分之九十幾,但在實際的視頻監(jiān)控上差距比較。從商務(wù)的角度上來講,這個差距在哪個地方?未來有什么樣的發(fā)展方向?
趙世范:在很多應(yīng)用情境下,多人臉識別的準(zhǔn)確率是很高的,比如說安檢通道,或者是固定的出入口。但是從別的行業(yè)應(yīng)用來看,人臉識別還有較大局限。第二個,在室外的話,拍攝的角度一般都是由上往下的,如果要真正做到人臉識別,架設(shè)高度只能接近兩米左右,而現(xiàn)在大多數(shù)攝像機的架設(shè)高度是3米以上的。另外,人在走路的時候會有擺動,拍攝下來人臉的照片不會是正向的。目前來看,室外環(huán)境下,識別準(zhǔn)確率能達到50%已經(jīng)很不錯。
余凱:我對人臉識別的話,持一個比較謹(jǐn)慎的觀點,考慮這件事情的話,至少要分三個維度:
第一個維度是場景;另外一個維度是應(yīng)用的任務(wù)。通常大家會混淆兩件事情,一個是人臉識別,一個是叫人臉驗證。人臉識別對應(yīng)的情景是,不知道這個人是誰,也沒有人告訴你這個人是誰。人臉驗證問題要簡單的多,近期內(nèi)有可能成為成熟的實用技術(shù)。而人臉識別技術(shù)在絕大部分場景都不實用。另外還有一個維度,我覺得是商業(yè)模式的問題,一項技術(shù)是整個產(chǎn)品里面的feature(特色、功能),還是說它本身就是一個產(chǎn)品?
王濤(主持人):解釋的非常清楚。刷臉技術(shù),很多情況是把驗證與識別混淆在一起,非常感謝余院長給我們的解釋。
趙世范:我再補充一點。不管有怎樣的驗證方式,它最終都有一個數(shù)據(jù)是存在計算機里面的,這個東西總有辦法能夠偷走,總有辦法能夠去欺騙通機器。人臉,可以做3D打印的面具;指紋,可以做指膜。而生物識別它是不可撤銷的,比如我們沒有辦法換自己的DNA,但數(shù)據(jù)本身是可以偷走的。生物特征是輔助識別,但是作為唯一的主識別的話,風(fēng)險是很大的。比如指紋失效的話,還可以按密碼。
開放大數(shù)據(jù),構(gòu)建生態(tài)圈
王濤(主持人):大數(shù)據(jù)時代首先的核心是數(shù)據(jù),大數(shù)據(jù)在未來是否會變成一個商品?甚至它的價值可以與石油來媲美?未來數(shù)據(jù)將開放、分享,而是建立大數(shù)據(jù)聯(lián)盟,怎么能夠高效的在數(shù)據(jù)分享平臺上進行工作,想請各位嘉賓談一談你們的看法。
趙世范:實際上,?挡]有數(shù)據(jù),?禐闃I(yè)主提供大量監(jiān)控的設(shè)備,但是這些數(shù)據(jù)都是屬于業(yè)主的。第二個,用戶已經(jīng)有大量的數(shù)據(jù),會提供一些技術(shù)手段幫助用戶進行數(shù)據(jù)的分析,但到底是提供數(shù)據(jù)還是提供服務(wù)是有商量余地的。數(shù)據(jù)共享最大的障礙是隱私的問題。如果別人拿數(shù)據(jù)用來犯罪,威脅到了當(dāng)事人的人身安全,這件事情怎么辦?大量的數(shù)據(jù)是堅決不允許拿走的。如果有少量的樣本數(shù)據(jù),拿過去之前,也要經(jīng)過脫敏的處理過程,像今天這種大數(shù)據(jù)分析的時候,脫敏的作用都不大,脫敏之后照樣可以窺探到用戶的隱私。
王濤(主持人):給出了非常有價值的觀點。谷女士來自于騰訊的微信,從騰訊來說,對于大數(shù)據(jù)的方向,你們對于這個方向有什么樣的看法?
谷沉沉:騰訊這幾年一直的觀點就是開放,我們希望把數(shù)據(jù)開放出來,但一定是保證安全的前提之下,保護用戶隱私的前提之下。我們可以把一些東西開放出來,給廣大的創(chuàng)業(yè)團隊,或者說其他的一些企業(yè),構(gòu)建一個互聯(lián)網(wǎng)、全方位的生態(tài)圈的,這有利于整個生態(tài)圈的發(fā)展。騰訊不會去拿大數(shù)據(jù)賣錢,騰訊公司肯定不會差這個錢。主要在于怎么去利用大數(shù)據(jù)幫助我們?nèi)ジ纳飘a(chǎn)品體驗,如果有一些想法,我們是非常開放的,歡迎大家一起來利用數(shù)據(jù)去改善業(yè)務(wù)。
大數(shù)據(jù)應(yīng)以人為本
王濤(主持人):想請6位嘉賓,最后用一句話回答一下我們的問題,大數(shù)據(jù)現(xiàn)在已經(jīng)變的更加繁榮,甚至更加智能。想請6位嘉賓,每人一句話,闡述一下對未來大數(shù)據(jù)演變的觀點,比如說未來大數(shù)據(jù)的發(fā)展,你們希望是什么樣的?
王井東:大數(shù)據(jù),特別是在圖像和視頻里面,應(yīng)關(guān)注怎么樣去幫助人們,怎樣令生活更加方便,我覺得基于此基礎(chǔ)之上的研究和開發(fā)才是有價值的。
趙世范:大數(shù)據(jù)的發(fā)展是以人為中心,提供讓人生活更好的環(huán)境。
侯宇濤:最主要把目前的一些社會事實進行一些量化,提供一些輔助決策手段,輔助人去做更多有利的事情。
谷沉沉:大數(shù)據(jù)在圖像視頻方面,可以告訴現(xiàn)在的用戶趨勢,告訴我們應(yīng)該從哪些方向去發(fā)展。另一方面以大數(shù)據(jù)平臺作為評價的體系,或許會發(fā)展成為行業(yè)標(biāo)準(zhǔn)。
王田:華為致力于未來全連接的網(wǎng)絡(luò)世界。全連接的網(wǎng)絡(luò)、智能化的大數(shù)據(jù)在一起,給人們的生活會帶來根本性的改變。
譚曉生:現(xiàn)在的大數(shù)據(jù)或者是智能化,是人類進化的一個必要階段。通過大數(shù)據(jù)進行分析之后,人們的隱私信息變得更加不安全。但是同樣大數(shù)據(jù)這個手段,可以為人們進行安全防御。所以我們總體的狀況是,既不會更好,也不會更糟。
王濤(主持人):感謝6位嘉賓對于未來大數(shù)據(jù)的演進提出非常精彩的預(yù)測。期待各位專家能夠借助這次論壇的討論,借助大數(shù)據(jù)的產(chǎn)業(yè)聯(lián)盟,希望大家對大數(shù)據(jù)的科研都能夠得到快速的發(fā)展,再次以熱烈的掌聲感謝6位專家,還有在座的各位的觀眾,謝謝你們的參與、你們的提問、你們的分享。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:眾企業(yè)高管激辯:大數(shù)據(jù)時代,如何抓住機遇迎接挑戰(zhàn)?
本文網(wǎng)址:http://www.ezxoed.cn/html/news/10515318196.html