作為機器學(xué)習(xí)的一個分支,深度學(xué)習(xí)可以說是當(dāng)下相當(dāng)熱門的一個話題。像Google、Microsoft、IBM這樣的巨頭都圍繞深度學(xué)習(xí)重點投資了一系列新興項目,他們的目標(biāo)是為了開發(fā)能夠?qū)W習(xí)越來越多復(fù)雜任務(wù)的神經(jīng)網(wǎng)絡(luò)。但是它是如何工作的呢?本文中我們一起來進行探討。
你有收到過垃圾郵件嗎?
當(dāng)下垃圾郵件過濾器早已替我們過濾掉大部分我們不想收到的電子郵件,且精度十分之高。但是并沒有多少人知道這些垃圾郵件是如何與正常郵件篩選開的。因為新的垃圾郵件地址能夠很容易重新注冊,所以不能簡單地基于發(fā)件人地址來進行過濾。第二個原因是垃圾郵件經(jīng)常是通過被第三方盜取的正常賬戶地址進行發(fā)送的。將垃圾郵件與正常郵件分開的最佳辦法是查看郵件信息中的具體內(nèi)容,目前用來做這個的最有效的方法正是基于機器學(xué)習(xí)。
機器學(xué)習(xí)通過自我學(xué)習(xí)系統(tǒng)來不斷改善自身,這些系統(tǒng)以一種自動化的方式來學(xué)習(xí)識別數(shù)據(jù)中的結(jié)構(gòu)。通過這種方式,系統(tǒng)能學(xué)會一個能進行數(shù)據(jù)解釋的模型,使用它我們能對未知的數(shù)據(jù)進行預(yù)測。一些有名的機器學(xué)習(xí)范例有面部識別、聲音識別、文本翻譯。另外,Google的無人駕駛汽車也使用了一些不同的機器學(xué)習(xí)系統(tǒng)來識別行人和交通信號指示。
基準(zhǔn)原則
機器學(xué)習(xí)的基準(zhǔn)原則相當(dāng)簡單,設(shè)想下我們想要建立一種能夠分辨蘋果和梨的機器。數(shù)字圖像是由一個物體、兩個稱為特征的值組成的,其中這些值是通過一小段手工代碼從數(shù)字圖像中提取的。這些代碼能提取圖像中對象的顏色(從紅色到綠色)以及對象的形狀(從圓形到橢圓形),F(xiàn)在想象一下,我們有一組包含蘋果和梨的圖像。對于每一個圖像,如果它包含一個蘋果或一個梨,我們會直接用這些圖像的標(biāo)簽來稱呼它。當(dāng)我們計算訓(xùn)練集中圖像的特性并將它們繪制出來的話,得到的結(jié)果如下圖所示。
圖1 計算訓(xùn)練集中圖像的特性
從上圖我們可以看出蘋果和梨的計算結(jié)果大部分都落在自己的區(qū)域,因此這兩個對象類別可以通過劃分成兩個不同的空間(藍色線條)來進行區(qū)分,F(xiàn)在如果給定一個新的對象圖片,我們可以通過計算特征并檢查它在空間中的位置來辨別它是一個蘋果還是一個梨。本質(zhì)上來說,算法已經(jīng)從數(shù)據(jù)中將蘋果和梨區(qū)分開了。
雖然情況看起來很樂觀,但是我們也注意到如果計算的特征離兩個對象的分類線(藍色線條)接近的話,系統(tǒng)會出現(xiàn)錯誤,比如說綠色橢圓形的蘋果以及又圓又紅的梨。因此,該算法的準(zhǔn)確度高度依賴于訓(xùn)練集上的樣本數(shù)目,以及所使用特征的質(zhì)量和數(shù)量。例如我們可以使用三分之一的特征來量化對象的結(jié)構(gòu),這樣也許增加了算法的準(zhǔn)確度,整個過程如下圖所示。
圖2 使用三分之一的特征來量化對象的結(jié)構(gòu)
深度學(xué)習(xí)
上述方法是機器學(xué)習(xí)的本質(zhì),這種方式被應(yīng)用了幾十年。最重要的一點是構(gòu)建對象類別是可分離的高質(zhì)量特征。然而有人可能會問,除了通過手工對其進行編碼之外,是否有可能直接學(xué)習(xí)這些特征嗎?這個確實是有可能的,而且從70年代起就已經(jīng)存在了。其中一種可以用來學(xué)習(xí)特征的方法就是神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)是基于大腦工作方式的方法。
人工智能神經(jīng)網(wǎng)絡(luò)是基于對單個大腦細(xì)胞進行建模的人工神經(jīng)元建成的,這些人工神經(jīng)元代表一個單位的運算。
人工神經(jīng)網(wǎng)絡(luò)接收不同的值作為輸入(例如從其他人工神經(jīng)元),然后通過一個簡單的方程運算產(chǎn)生一個單一的輸出值,此輸出值可以作為其他神經(jīng)元的輸入值。通過連接各層中的神經(jīng)元,我們構(gòu)筑了一個大型人工神經(jīng)網(wǎng)絡(luò)。既然單個神經(jīng)元執(zhí)行簡單的計算行為,那么網(wǎng)絡(luò)作為一個整體可以執(zhí)行一個非常復(fù)雜的運算。下圖展示了這個過程,圓代表了神經(jīng)元,線條代表輸出——輸入神經(jīng)元之間的連接。關(guān)于神經(jīng)網(wǎng)絡(luò)一件有趣的事是他們會自動學(xué)習(xí)所需的特征。可以想象有一個神經(jīng)網(wǎng)絡(luò),通過直接學(xué)習(xí)它接收的輸入圖像特征(顏色、形狀)將蘋果和梨分開。
圖3 圖像特征(顏色、形狀)
深度學(xué)習(xí)中的“深度”指代的是神經(jīng)網(wǎng)絡(luò)中的層級數(shù)目,深度在學(xué)習(xí)良好特征上扮演了相當(dāng)重要的角色。這是因為每一層都會基于上一層的特征學(xué)會另外一系列特征。神經(jīng)網(wǎng)絡(luò)越深,其能學(xué)會的特征越復(fù)雜。想要更深入地了解神經(jīng)網(wǎng)絡(luò)的工作原理可以下圖簡單了解,也通過下面的鏈接:playground.tensorflow.org詳細(xì)觀看演示。
雖然神經(jīng)網(wǎng)絡(luò)可以通過自身學(xué)會特征,但是這些通常不會應(yīng)用到實踐中。這樣做的其實有兩個原因,第一是其需要大量的訓(xùn)練樣本,第二是要學(xué)會良好的特征需要許多層級,這反過來又需要大量的計算能力。隨著近幾年來大數(shù)據(jù)的興起和計算能力的增加,在實踐中應(yīng)用這些神經(jīng)網(wǎng)絡(luò)已經(jīng)成為可能。神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)到比手工構(gòu)造更復(fù)雜的特征,因此他們往往比手工編碼系統(tǒng)要表現(xiàn)優(yōu)異。
應(yīng)用
機器學(xué)習(xí)和深度學(xué)習(xí)是廣泛適用的,它不僅限于工農(nóng)業(yè)中的將梨和蘋果分開的應(yīng)用。例如有個系統(tǒng)能夠通過醫(yī)療掃描學(xué)會從健康的細(xì)胞中識別癌細(xì)胞,在過去的幾年中這個系統(tǒng)的精度有了迅速的提高。再如Facebook創(chuàng)造了一個類似Siri的系統(tǒng),它能夠以高精度分析圖片的內(nèi)容,還可以回答關(guān)于圖像內(nèi)容的問題。
雖然這些類型的系統(tǒng)并沒有比人類表現(xiàn)的更好,但是存在一些專業(yè)系統(tǒng),其在自身領(lǐng)域中早已超過人類的表現(xiàn)。例如,微軟開發(fā)的一個應(yīng)用能夠高精度的識別狗的品種,比人類正確率要高。如下圖所示。
圖4 微軟開發(fā)的一個應(yīng)用能夠高精度的識別狗的品種
機器學(xué)習(xí)不僅可用于分類識別,也可用于文本分析。例如一個神經(jīng)網(wǎng)絡(luò)能夠被用來提取文本中的觀點,可以表明文本所持觀點是否積極或者消極。這是一個相當(dāng)有名的技術(shù),其應(yīng)用包括自動評估產(chǎn)品的評論內(nèi)容。
在我看來,機器學(xué)習(xí)最令人印象深刻的應(yīng)用是在人工智能領(lǐng)域,神經(jīng)網(wǎng)絡(luò)與強化學(xué)習(xí)結(jié)合使得構(gòu)筑能從自身環(huán)境中進行學(xué)習(xí)的智能agents稱為可能。
最好的例子是Google Deepmind所推出的系統(tǒng),它能夠通過完全自主的試驗和錯誤來學(xué)習(xí)如何玩雅達利(Atari)視頻游戲。該系統(tǒng)就像人類玩家一樣只接收屏幕輸入,也只產(chǎn)生視頻游戲控制器上的按壓信號,在一些電子游戲中該系統(tǒng)實際上表現(xiàn)優(yōu)于人類。
圖5 電子游戲中該系統(tǒng)實際上表現(xiàn)優(yōu)于人類
就目前來看,深度學(xué)習(xí)日后發(fā)展的潛力可以說是相當(dāng)巨大的,希望通過本文的介紹你對深度學(xué)習(xí)會有一個基本了解。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:深度學(xué)習(xí)簡明教程
本文網(wǎng)址:http://www.ezxoed.cn/html/support/11121819848.html