簡單總結(jié)李彥宏的演講:
他認(rèn)為,移動互聯(lián)網(wǎng)之后人工智能是百度的核心。三年前的“百度大腦”就已經(jīng)具備了兩三歲孩子的智力水平。百度今天同時擁有超大規(guī)模的計算資源、中國最大的GPU集群以及國內(nèi)最為豐富(如果不是之一的話)的搜索、圖像、視頻、定位數(shù)據(jù),百度今天的“大腦”已經(jīng)成長到什么水平?
以下是李彥宏的演講實錄全文:
在這之前,互聯(lián)網(wǎng)的發(fā)展已經(jīng)經(jīng)過兩個重要階段,也就是PC互聯(lián)網(wǎng)階段;第二個是最近四五年移動互聯(lián)網(wǎng)階段。中國7億網(wǎng)民都用上了智能手機,上網(wǎng)人口滲透率已經(jīng)超過50%。互聯(lián)網(wǎng)的發(fā)展已經(jīng)不能靠人口紅利來驅(qū)動了。
當(dāng)前,中國進(jìn)入到經(jīng)濟(jì)的新常態(tài),國家也提倡互聯(lián)網(wǎng)+,實際上是希望我們用互聯(lián)網(wǎng)的效率來推動行業(yè)的發(fā)展。整個中國的經(jīng)濟(jì)增長需要依靠互聯(lián)網(wǎng),但是互聯(lián)網(wǎng)的增長卻遇到了瓶頸,過去粗放式的野蠻增長沒有了,互聯(lián)網(wǎng)行業(yè)從業(yè)者感受到深深的危機。
移動互聯(lián)網(wǎng)的下一幕,是人工智能。對于百度來說這是核心中的核心,過去百度投了很大的研發(fā)精力。對于百度來說意味著什么?用四個字形容就是百度大腦,三年前,百度就講過“百度大腦”這個概念。那個時候的百度大腦已經(jīng)具備了大概兩三歲孩子的智力水平。
今天很多人問我,百度大腦相當(dāng)于多少歲的人腦呢?回答這個問題還蠻難的。百度大腦和人腦的正常發(fā)育過程很不一樣。
百度大腦包括三個部分:計算方法,包括超大規(guī)模的神經(jīng)網(wǎng)絡(luò)、萬億級的參數(shù)、千億樣本和千億特征訓(xùn)練;計算能力,包括數(shù)十萬臺服務(wù)器構(gòu)成了“百度大腦”的實體,幾年前百度便開始自建中國最大的GPU集群,不是傳統(tǒng)基于CPU的服務(wù)器,而是GPU,GPU早年在游戲領(lǐng)域使用廣泛,適用于深度計算;數(shù)據(jù),全網(wǎng)的網(wǎng)頁數(shù)據(jù)、十多年來累積的搜索數(shù)據(jù),以及百億級的圖像、視頻、定位數(shù)據(jù)。這樣,百度大腦就可以開始工作了。
百度大腦有哪些能力?四個能力,語音、圖像、自然語言理解和用戶畫像。
第一個語音已經(jīng)進(jìn)入相對成熟的階段。
百度大腦的語音識別已經(jīng)到了第二代,使用深度學(xué)習(xí)的技術(shù)進(jìn)行語音識別。百度語音識別的準(zhǔn)確率能夠達(dá)到97%,已經(jīng)超過了人對語音的識別能力。
這樣的能力到底可以在什么地方幫助到我們?舉個例子,很多公司都有自己的電話銷售部門,這個行業(yè)人員流動性很大,而銷售人員需要長時間培訓(xùn)才能上崗。即使是經(jīng)過培訓(xùn),甚至有一定經(jīng)驗的銷售人員,每個人銷售效率也是參差不齊的。但是通過百度語音識別能力,一個新的銷售上崗的第一天,就可能掌握他所獲得的最優(yōu)秀的銷售能力:
新銷售打電話給潛在客戶的時候,客戶每說一句話,客戶每問一個問題,百度大腦都實時地識別了問題,并且顯示在銷售的電腦的屏幕上,屏幕上不僅實時展示了客戶的問題,而且實時地把最優(yōu)秀的銷售是怎么回答這個客戶的問題也展示在這個屏幕上。這樣,新的銷售的工作就簡單多了,其實他基本上可以照著屏幕念,就能夠達(dá)到最優(yōu)秀的銷售的話術(shù)水平。
語音識別還有很多應(yīng)用場景,大家可以根據(jù)自己的行業(yè)背景去想象。
語音能力分為兩個方向,語音合成和語音識別。
語音合成是把文字轉(zhuǎn)換成語音,用自然人的聲音讀出來,而不是以前的勻速無表情的語音。目前,百度每天響應(yīng)的語音合成的請求達(dá)到了2.5億次。在情感語音合成技術(shù)上線后,用語音聽小說的百度用戶從過去平均每天聽0.69小時,增長到現(xiàn)在的2.21小時。
今天,語音合成還可以根據(jù)個人需求進(jìn)行定制,形成自然發(fā)聲的能力,模擬任何一個你喜歡的人的說話方式。百度地圖中有一個李彥宏導(dǎo)航語音包,其實我并沒有說過那些話,就是根據(jù)我日常的語音合成的。
我們現(xiàn)場合成一下13年前去世的張國榮的聲音。合成張國榮的聲音比較難,國語的語調(diào)比較少。以張國榮在影視、電臺等留存下來的原聲進(jìn)行建模,通過情感語音合成技術(shù)實現(xiàn)合成。
任何一個人只要用30分鐘按照要求錄制50句話,就可以用百度大腦的語音合成技術(shù)模擬出來這個人的聲音。人人都可以擁有自己的聲音模型。
第二個圖像識別能力是如何實現(xiàn)的?
從技術(shù)的角度講,它是通過對人臉特征的關(guān)鍵點的提取,找到了其中最不一樣的地方,構(gòu)成了一個面部的表情。當(dāng)一個人表情發(fā)生變化的時候,他的表情特征并不會發(fā)生改變。
除了人臉識別之外,百度在其他場景中也經(jīng)常會遇到圖像識別需求。計算機視覺或者圖像識別技術(shù)是無人車的最后一公里。過去一年,百度花了不少精力提升百度無人車在城市道路的運行水平。百度無人車在行駛過程中,通過感知,可以探測到路面上車、路標(biāo)以及各種各樣的障礙物,每個物體有一個獨特的編號,便于車對它進(jìn)行識別。這個車的識別是通過百度大腦來識別的。今年8月份KITTI評測的最新成績顯示,百度無人車在車輛檢測中排名第一,車輛跟蹤6項指標(biāo)中取得4項第一。
下一個是增強現(xiàn)實,廣告主可以把現(xiàn)實產(chǎn)品和希望展示的場景聯(lián)系起來展示給消費者。歐萊雅與百度合作,拍洗發(fā)水就可以準(zhǔn)確識別并和用戶互動。
第三種是自然語言處理能力,目前發(fā)展程度不如圖像識別。
去年在百度世界大會上推出的度秘,是個人智能助理,F(xiàn)在度秘和用戶進(jìn)行溝通的方式和傳統(tǒng)的搜索已經(jīng)很不一樣了,有56%是通過語音或者圖像來完成的,語音和圖像的交互正逐步超越傳統(tǒng)文字的使用頻次,成為人們表達(dá)需求的主流方式。
除此之外,更核心的技術(shù)是用人的語音進(jìn)行交流,雖然不是每一次度秘都能理解。今年奧運期間,百度機器人度秘搭檔知名解說員楊毅,進(jìn)行里約奧運男籃首場四分之一決賽解說。
最后一個用戶畫像能力。
通過大量的用戶行為數(shù)據(jù),百度大腦能夠描繪出著名演員胡歌的粉絲群體的基本特點。胡歌粉絲群體的畫像我們從興趣和偏好的角度來看,其實在影視、音樂、公益、旅游、出行。我們看到這里面最大的一個特點還是旅游出行,而不是影視音樂,還是跟常人的思維不太一樣。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:李彥宏:百度大腦為什么是“核心中的核心”?
本文網(wǎng)址:http://www.ezxoed.cn/html/news/10515320035.html