0 引言
隨著企業(yè)信息化建設(shè)的加強(qiáng),MES在企業(yè)生產(chǎn)信息化建設(shè)中的作用越來(lái)越重要.MES系統(tǒng)中的數(shù)據(jù)挖掘主要針對(duì)于過(guò)程監(jiān)控中的大量生產(chǎn)的日志數(shù)據(jù).通過(guò)這些數(shù)據(jù)分析,對(duì)生產(chǎn)過(guò)程中的數(shù)據(jù)變化進(jìn)行實(shí)時(shí)監(jiān)測(cè),以此來(lái)得到生產(chǎn)狀態(tài)而進(jìn)行結(jié)果判別.
國(guó)際MES協(xié)會(huì)對(duì)MES定義為“一個(gè)提供信息的系統(tǒng),以優(yōu)化從定單到成品的生產(chǎn)活動(dòng).使用當(dāng)前的和精確的實(shí)時(shí)數(shù)據(jù),MES指導(dǎo)廠級(jí)活動(dòng),并對(duì)發(fā)生的活動(dòng)進(jìn)行響應(yīng)和匯報(bào),形成對(duì)變化條件的迅速響應(yīng),并專注于減少無(wú)價(jià)值的活動(dòng),從而驅(qū)動(dòng)有效的廠級(jí)操作和過(guò)程”.
生產(chǎn)過(guò)程是一個(gè)復(fù)雜的而且具有周期的多樣性的過(guò)程,采用傳統(tǒng)的數(shù)據(jù)分析方法,很難進(jìn)行建模和處理.粗糙集(RoughSet,RS)就是一種新型的數(shù)據(jù)處理的軟計(jì)算方法,它甚至不需要數(shù)據(jù)的任何檢驗(yàn)或者附加的信息(比如數(shù)學(xué)統(tǒng)計(jì)上的概率分布,模糊集理論中的模糊度劃分,神經(jīng)網(wǎng)絡(luò)中一定數(shù)量的訓(xùn)練樣本等),而是直接從已知數(shù)據(jù)的初始狀態(tài)系統(tǒng)出發(fā),通過(guò)不可分辨關(guān)系和不可分辨類確定給定問(wèn)題的近似解,從而有效地進(jìn)行分析和處理不精確、不完整的信息,并有效地進(jìn)行屬性約簡(jiǎn)并進(jìn)行正確的動(dòng)態(tài)調(diào)度.
1 基于粗糙集的數(shù)據(jù)挖掘算法
粗糙集的方法和模型建立在一種直觀的二維表的基礎(chǔ)上,所以可以采用知識(shí)表示系統(tǒng)和決策系統(tǒng)對(duì)問(wèn)題進(jìn)行描述.由于互信息方法在精度等方面的有可能表現(xiàn)不足,我們可以通過(guò)引入粗糙集,得出一種基于關(guān)系積理論和知識(shí)表示的屬性約簡(jiǎn)算法,從而提出一個(gè)適用于海量文本數(shù)據(jù)集的特征選擇方式.利用此方法來(lái)進(jìn)行互信息特征初選,利用屬性約簡(jiǎn)算法來(lái)消除冗余,獲得具有代表性的特征詞.結(jié)果表明,該性約簡(jiǎn)算法方法能獲得冗余度小且具有代表性的特征子集.使用關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘中一種重要的方法,最開(kāi)始是由R.Agrawal等人在1993年提出的,主要用于發(fā)現(xiàn)事務(wù)數(shù)據(jù)庫(kù)中不同商品之間的聯(lián)系,從而找出顧客購(gòu)買行為模式等行為.此算法的核心就是Apriori算法,即基于兩階段大項(xiàng)集思想的方法,將關(guān)聯(lián)規(guī)則用于數(shù)據(jù)挖掘算法的設(shè)計(jì)可以分解為兩個(gè)子問(wèn)題:
(1)找出所有支持度中大于最小支持度的項(xiàng)集(Itemset),并把這些項(xiàng)集稱為大項(xiàng)集(Large Itemset).
(2)使用第1步找到的大項(xiàng)集產(chǎn)生相應(yīng)的關(guān)聯(lián)規(guī)則.
從關(guān)聯(lián)規(guī)則的支持度和置信度出發(fā),那么在事務(wù)數(shù)據(jù)庫(kù)中就存在無(wú)窮多的關(guān)聯(lián)規(guī)則和置信度.人們一般只對(duì)滿足一定的支持度和置信度的關(guān)聯(lián)規(guī)則非常關(guān)注.科學(xué)論文中,一般稱滿足一定要求的(如大的支持度和置信度)的關(guān)聯(lián)規(guī)則為強(qiáng)規(guī)則.所以,為了找到有意義的關(guān)聯(lián)規(guī)則,需要給定兩個(gè)數(shù)據(jù):最小支持度和最小置信度.前者稱為用戶規(guī)定的關(guān)聯(lián)規(guī)則必須滿足的最小支持度,它表示了一組物品集在統(tǒng)計(jì)意義上的最低程度;后者即用戶規(guī)定的關(guān)聯(lián)規(guī)則必須要滿足的最小置信度,它直接反應(yīng)了關(guān)聯(lián)規(guī)則的最低可靠度.
2 數(shù)據(jù)挖掘算法在MES系統(tǒng)中研究與應(yīng)用
生產(chǎn)執(zhí)行過(guò)程中的數(shù)據(jù)挖掘算法是一種新技術(shù),新方法,所以還沒(méi)有形成完整的理論體系,它的應(yīng)用都是針對(duì)具體問(wèn)題展開(kāi)研究,其廣度和深度需要進(jìn)一步拓展.
在生產(chǎn)過(guò)程中,計(jì)算機(jī)系統(tǒng)記錄和保存的數(shù)據(jù)是時(shí)間上連續(xù)變化的數(shù)據(jù)經(jīng)采樣、量化得到.它在本質(zhì)上是連續(xù)的,變化過(guò)程受生產(chǎn)狀態(tài)約束;其次,生產(chǎn)過(guò)程中的行為、特性等元素是由許多過(guò)程變量共同決定的,而且任何一個(gè)變量的變化都影響其它變量以及生產(chǎn)狀態(tài)的變化,所以在空間上,生產(chǎn)過(guò)程數(shù)據(jù)和變量具有高維數(shù)、強(qiáng)關(guān)聯(lián)和非線性等特點(diǎn).但是與一般商業(yè)上的數(shù)據(jù)不同存在區(qū)別,比如零售業(yè)數(shù)據(jù)庫(kù)中的的數(shù)據(jù)是關(guān)于商品的名稱和數(shù)量的數(shù)據(jù),這些數(shù)據(jù)在本質(zhì)上是分散的,而且在時(shí)間域無(wú)約束,在空間域的特點(diǎn)也不同于生產(chǎn)過(guò)程數(shù)據(jù),所以數(shù)據(jù)特點(diǎn)不同,采用的挖掘算法不同,特征提取的方法也不同.
預(yù)測(cè)在數(shù)據(jù)挖掘算法中具有重要應(yīng)用領(lǐng)域,對(duì)生產(chǎn)過(guò)程有著重要的指導(dǎo)意義.在預(yù)測(cè)研究方法中,確定關(guān)鍵因子是非常重要的一環(huán),以前的預(yù)測(cè)方法所涉及因子比較少,所以它的結(jié)論具有一定的局限性.?dāng)?shù)據(jù)挖掘算法的優(yōu)點(diǎn)就是從海量數(shù)據(jù)中找到潛在有用且有關(guān)聯(lián)的信息.
由于各種干擾,生產(chǎn)過(guò)程數(shù)據(jù)中含有大量的噪聲和雜質(zhì);生產(chǎn)過(guò)程中存在大量的不確定性和機(jī)動(dòng)性,造成生產(chǎn)數(shù)據(jù)也存在大量的不確定性.因?yàn)閿?shù)據(jù)中的噪聲影響算法的有效性和結(jié)論的可靠性,所以給數(shù)據(jù)中的不確定性給知識(shí)提取帶來(lái)了困難.生產(chǎn)過(guò)程不同的部分其特性不同,要求也不一樣,因此對(duì)不同部分變量的采樣使用不同的采樣頻率,這使得過(guò)程變量具有多標(biāo)度特點(diǎn).
本文根據(jù)生產(chǎn)執(zhí)行的全過(guò)程,結(jié)合粗糙集的屬性約簡(jiǎn)改進(jìn)了Apriori算法,從而使它適合生產(chǎn)過(guò)程中的知識(shí)發(fā)現(xiàn)和數(shù)據(jù)挖掘.算法Apriori-MES的詳細(xì)流程如圖1所示.
圖1 Apriori MES流程圖
3 結(jié)束語(yǔ)
本文針對(duì)MES系統(tǒng)的特點(diǎn),運(yùn)用先前提出的一套Apriori—MES算法,并且將此算法在實(shí)際的數(shù)據(jù)挖掘系統(tǒng)中得到了實(shí)現(xiàn),但是MES系統(tǒng)中尚待研究的問(wèn)題還有很多,主要有:
(1)從尋求數(shù)據(jù)挖掘過(guò)程中的可視化方法出發(fā),使知識(shí)發(fā)現(xiàn)的過(guò)程能夠被用戶認(rèn)識(shí),也便于在知識(shí)發(fā)現(xiàn)的過(guò)程中進(jìn)行人機(jī)交互和應(yīng)用,以及能夠反應(yīng)不同生產(chǎn)工序之間關(guān)系的圖形顯示.
(2)生產(chǎn)過(guò)程中不同的過(guò)程造成不同的特性,要求也會(huì)一樣,因此對(duì)不同部分變量的采樣使用了不同的采樣頻率,這使得過(guò)程變量具有多標(biāo)度的特點(diǎn),目前的數(shù)據(jù)挖掘算法還不能處理這類數(shù)據(jù).
(3)將KDD技術(shù)與在線分析處理(OLAP)技術(shù)、數(shù)據(jù)查詢有機(jī)的相結(jié)合,因?yàn)橛脩羰褂脭?shù)據(jù)挖掘系統(tǒng)時(shí),他們的要求具有不確定性,數(shù)據(jù)查詢可以提供給用戶一個(gè)簡(jiǎn)單的,靈活多變的分析數(shù)據(jù)庫(kù)結(jié)構(gòu)和數(shù)據(jù)簡(jiǎn)單特征的工具.
(4)在實(shí)際應(yīng)用中,許多算法不能有效的工作是因?yàn)榫薮蟮臄?shù)據(jù)量.一個(gè)有效的算法必須能存儲(chǔ)這樣巨大的數(shù)據(jù),算法運(yùn)算的時(shí)間必須是合理的。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:基于粗糙集的數(shù)據(jù)挖掘算法在MES/ERP系統(tǒng)的研究與應(yīng)用
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/10820211554.html