機(jī)器學(xué)習(xí)工程師是開發(fā)產(chǎn)品和構(gòu)建算法團(tuán)隊(duì)中的一部分,并確保其可靠、快速和成規(guī)模地工作。他們和數(shù)據(jù)科學(xué)家密切合作來了解理論知識和行業(yè)應(yīng)用。數(shù)據(jù)專家和機(jī)器學(xué)習(xí)工程師的主要區(qū)別是:
機(jī)器學(xué)習(xí)工程師構(gòu)建、開發(fā)和維護(hù)機(jī)器學(xué)習(xí)系統(tǒng)的產(chǎn)品。
數(shù)據(jù)專家進(jìn)行調(diào)查研究形成有關(guān)于機(jī)器學(xué)習(xí)項(xiàng)目的想法,然后分析來理解機(jī)器學(xué)習(xí)系統(tǒng)的度量影響。
下面是機(jī)器學(xué)習(xí)的框架介紹:
1.Apache Singa 是一個用于在大型數(shù)據(jù)集上訓(xùn)練深度學(xué)習(xí)的通用分布式深度學(xué)習(xí)平臺,它是基于分層抽象的簡單開發(fā)模型設(shè)計(jì)的。它還支持各種當(dāng)前流行的深度學(xué)習(xí)模型,有前饋模型(卷積神經(jīng)網(wǎng)絡(luò),CNN),能量模型(受限玻爾茲曼機(jī),RBM和循環(huán)神經(jīng)網(wǎng)絡(luò),RNN),還為用戶提供了許多內(nèi)嵌層。
2.Amazon Machine Learning(AML)是一種讓各種級別使用機(jī)器學(xué)習(xí)技術(shù)的開發(fā)人員可輕松掌握的一個服務(wù),提供了視覺工具和向?qū),可以指?dǎo)您在不必學(xué)習(xí)復(fù)雜的機(jī)器學(xué)習(xí)算法和技術(shù)的情況下建立機(jī)器學(xué)習(xí)。
3.Azure ML Studio允許微軟Azure的用戶創(chuàng)建和訓(xùn)練模型,隨后將這些模型轉(zhuǎn)化為能被其他服務(wù)使用的API。盡管您可以將自己的Azure存儲鏈接到更大模型的服務(wù),但是每個賬戶模型數(shù)據(jù)的存儲容量最多不超過10GB。在Azure中有大量的算法可供使用,這要感謝微軟和一些第三方。甚至你都不需要注冊賬號,就可以匿名登錄,使用Azure ML Studio服務(wù)長達(dá)8小時。
4.Caffe是由伯克利視覺學(xué)習(xí)中心(BLVC)和社區(qū)貢獻(xiàn)者們基于BSD-2-協(xié)議開發(fā)的一個深度學(xué)習(xí)框架,它秉承“表示、效率和模塊化”的開發(fā)理念。模型和組合優(yōu)化通過配置而不是硬編碼實(shí)現(xiàn),并且用戶可根據(jù)需要在CPU處理和GPU處理之間進(jìn)行切換,Caffe的高效性使其在實(shí)驗(yàn)研究和產(chǎn)業(yè)部署中的表現(xiàn)很完美,使用單個NVIDIA K40 GPU處理器每天即可處理超過六千萬張圖像 。
5.H2O使人輕松地應(yīng)用數(shù)學(xué)和預(yù)測分析來解決當(dāng)今極具挑戰(zhàn)性的商業(yè)問題,它巧妙的結(jié)合了目前在其他機(jī)器學(xué)習(xí)平臺還未被使用的獨(dú)有特點(diǎn):最佳開源技術(shù),易于使用的WebUI和熟悉的界面,支持常見的數(shù)據(jù)庫和不同文件類型。用H2O,你可以使用現(xiàn)有的語言和工具。此外,也還可以無縫擴(kuò)展到Hadoop環(huán)境中。
6.Massive Online Analysis (M
OA)是目前最受歡迎的數(shù)據(jù)流挖掘開源框架,擁有一個非;钴S的社區(qū)。它包含一系列的機(jī)器學(xué)習(xí)算法(分類,回歸,聚類,離群檢測,概念漂移檢測和推薦系統(tǒng))和評價工具。和WEKA項(xiàng)目一樣,MOA 也是用Java編寫,但擴(kuò)展性更好。
7.MLlib (Spark)是Apache Spark的機(jī)器學(xué)習(xí)庫,目的是讓機(jī)器學(xué)習(xí)實(shí)現(xiàn)可伸縮性和易操作性,它由常見的學(xué)習(xí)算法和實(shí)用程序組成,包括分類、回歸、聚類,協(xié)同過濾、降維,同時包括底層優(yōu)化原生語言和高層管道API。
8.Mlpack是一個基于C++的基礎(chǔ)學(xué)習(xí)庫 ,最早于2011年推出,據(jù)庫的開發(fā)者聲稱,它秉承“可擴(kuò)展性、高效性和易用性”的理念來設(shè)計(jì)的。執(zhí)行Mlpack有兩種方法:通過快速處理簡易的“黑盒”操作命令行執(zhí)行的緩存,或者借助C++ API處理較為復(fù)雜的工作。Mlpack可提供簡單的能被整合到大型的機(jī)器學(xué)習(xí)解決方案中的命令行程序和C++的類。
9.Pattern是Python編程語言的web挖掘組件,有數(shù)據(jù)挖掘工具( Google、Twitter 、Wikipedia API,網(wǎng)絡(luò)爬蟲,HTML DOM解析器),自然語言處理(詞性標(biāo)注,n-gram搜索,情感分析,WordNet接口),機(jī)器學(xué)習(xí)(向量空間模型,聚類,支持向量機(jī)),網(wǎng)絡(luò)分析和
10.Scikit-Learn為了數(shù)學(xué)和科學(xué)工作,基于現(xiàn)有的幾個Python包(Numpy,SciPy和matplotlib)拓展了Python的使用范圍。最終生成的庫既可用于交互式工作臺應(yīng)用程序,也可嵌入到其他軟件中進(jìn)行復(fù)用。該工具包基于BSD協(xié)議,是完全免費(fèi)開源的,可重復(fù)利用。Scikit-Learn中含有多種用于機(jī)器學(xué)習(xí)任務(wù)的工具,如聚類,分類,回歸等。Scikit-Learn是由擁有眾多開發(fā)者和機(jī)器學(xué)習(xí)專家的大型社區(qū)開發(fā)的,因此,Scikit-Learn中最前沿的技術(shù)往往會在很短時間內(nèi)被開發(fā)出來。
11.Shogu是最早的機(jī)器學(xué)習(xí)庫之一,它創(chuàng)建于1999年,用C++開發(fā),但并不局限于C++環(huán)境。借助SWIG庫,Shogun適用于各種語言環(huán)境,如Java,Python,c#,Ruby,R,Lua,Octave和Mablab。Shogun 旨在面向廣泛的特定類型和學(xué)習(xí)配置環(huán)境進(jìn)行統(tǒng)一的大規(guī)模學(xué)習(xí),如分類,回歸或探索性數(shù)據(jù)分析。
12.TensorFlow是一個使用數(shù)據(jù)流圖進(jìn)行數(shù)值運(yùn)算的開源軟件庫,它實(shí)現(xiàn)了數(shù)據(jù)流圖,其中,張量(“tensors”)可由一系列圖形描述的算法來處理,數(shù)據(jù)在該系統(tǒng)中的變化被稱為“流”,由此而得名。數(shù)據(jù)流可用C++或Python編碼后在CPU或GPU的設(shè)備上運(yùn)行。
13.Theano是一個基于BSD協(xié)議發(fā)布的可定義、可優(yōu)化和可數(shù)值計(jì)算的Phython庫。使用Theano也可以達(dá)到與用C實(shí)現(xiàn)大數(shù)據(jù)處理的速度相媲美,是支持高效機(jī)器學(xué)習(xí)的算法。
14.Torch是一種廣泛支持把GPU放在首位的機(jī)器學(xué)習(xí)算法的科學(xué)計(jì)算框架。由于使用了簡單快速的腳本語言LuaJIT和底層的C/CUDA來實(shí)現(xiàn),使得該框架易于使用且高效。Torch目標(biāo)是讓你通過極其簡單的過程、最大的靈活性和速度建立自己的科學(xué)算法。Torch是基于Lua開發(fā)的,擁有一個龐大的生態(tài)社區(qū)驅(qū)動庫包設(shè)計(jì)機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺、信號處理,并行處理,圖像,視頻,音頻和網(wǎng)絡(luò)等。
15.Veles是一套用C++開發(fā)的面向深層學(xué)習(xí)應(yīng)用程序的分布式平臺,不過它利用Python在節(jié)點(diǎn)間自動操作與協(xié)作任務(wù)。在相關(guān)數(shù)據(jù)集中到該集群之前,可對數(shù)據(jù)進(jìn)行分析與自動標(biāo)準(zhǔn)化調(diào)整,且REST API允許將各已訓(xùn)練模型立即添加至生產(chǎn)環(huán)境當(dāng)中,它側(cè)重于性能和靈活性。Veles幾乎沒有硬編碼,可對所有廣泛認(rèn)可的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)進(jìn)行訓(xùn)練,如全卷積神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò),循環(huán)神經(jīng)網(wǎng)絡(luò)等。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:機(jī)器學(xué)習(xí)必知的15大框架
本文網(wǎng)址:http://www.ezxoed.cn/html/support/11121524032.html