在電信行業(yè),運(yùn)營商構(gòu)建了非常多的應(yīng)用系統(tǒng)為廣大消費(fèi)者提供各種特色服務(wù),有一些系統(tǒng)的功能由于在業(yè)務(wù)操作的上下文中,涉及到多個業(yè)務(wù)系統(tǒng)的子功能,需要多個系統(tǒng)共同提供服務(wù)才能正常工作,導(dǎo)致任何系統(tǒng)出現(xiàn)異常都會影響到其余的系統(tǒng),對企業(yè)形象和社會造成非常惡劣的影響。
而各業(yè)務(wù)系統(tǒng)的應(yīng)用日志是了解業(yè)務(wù)系統(tǒng)是否正常運(yùn)行的最直接可靠的窗口,通過統(tǒng)一收集、分類應(yīng)用日志,并實(shí)現(xiàn)日志分析,可實(shí)現(xiàn)如下價值:
-
加強(qiáng)網(wǎng)絡(luò)運(yùn)營效率:收集各類設(shè)備和應(yīng)用的關(guān)聯(lián)行為,分析網(wǎng)絡(luò)通信服務(wù)質(zhì)量,實(shí)現(xiàn)系統(tǒng)運(yùn)維監(jiān)控,提升網(wǎng)絡(luò)工作效率,改善客戶使用體驗(yàn)。
-
合理配置渠道資源:針對不同類型與喜好特點(diǎn)的客戶群體,按渠道投放差異化的產(chǎn)品和服務(wù),提高渠道利用效率。
-
客戶畫像與精確營銷:記錄客戶在各種渠道的行為和接觸信息,預(yù)測客戶行為動機(jī),從而準(zhǔn)確地推送個性化的服務(wù)和產(chǎn)品。
因此,電信運(yùn)營商對于應(yīng)用日志的監(jiān)控力度非常大,一旦出現(xiàn)異常信號,需要及時通知操作人員進(jìn)行問題定位與問題解決。但這種方式只能進(jìn)行問題的事后補(bǔ)救處理,不能預(yù)先發(fā)現(xiàn)應(yīng)用系統(tǒng)的隱藏問題。而且由于日志數(shù)據(jù)是典型的文本類半結(jié)構(gòu)化大數(shù)據(jù),傳統(tǒng)的關(guān)系型數(shù)據(jù)庫無法滿足海量日志數(shù)據(jù)的存儲與實(shí)時查詢分析需求。
1.用戶業(yè)務(wù)需求
-
業(yè)務(wù)問題溯源查詢,響應(yīng)時間3秒內(nèi)
-
多維度分析結(jié)果的聚集與實(shí)時展現(xiàn)
2.業(yè)務(wù)與技術(shù)挑戰(zhàn)
原解決方案
如下圖所示,用戶在項(xiàng)目初期基于Hadoop HDFS及Greenplum構(gòu)建日志監(jiān)控系統(tǒng),并將原始日志文件保存在NAS文件系統(tǒng)中。
然后通過流處理引擎將日志中的每個交易號對應(yīng)的日志報文對應(yīng)文件的偏移記錄(位置)轉(zhuǎn)換成一個格式化記錄,并將生成的數(shù)據(jù)保存在 GP(Greenplum) 中。
用戶如果希望查詢某個交易號的明細(xì)日志,需要先到GP 庫中查找這個交易號對應(yīng)在哪個文件中,并且知道了它在文件的偏移情況,打開文件,跳轉(zhuǎn)到對應(yīng)的偏移上,才能看在完整的明細(xì)日志。
原方案存在問題與不足如下:
-
當(dāng)應(yīng)用日志數(shù)據(jù)量越來越大時,流處理引擎、GP 和NAS 的管理會越加復(fù)雜、困難。
-
將日志存放在NAS 的方法,Hadoop分布式計(jì)算框架很難與其整合,無法使用簡單工具(如Hive等)進(jìn)行日志分析。
3.解決方案
用戶基于SequoiaDB數(shù)據(jù)庫+Hadoop框架重構(gòu)了智能日志分析系統(tǒng),在已有日志監(jiān)控系統(tǒng)基礎(chǔ)上增加智能日志分析功能,可自動根據(jù)應(yīng)用日志分析錯誤隱患,提高應(yīng)用的糾錯能力。
如上圖所示,數(shù)據(jù)采集端將新增數(shù)據(jù)實(shí)時加載到SequoiaDB數(shù)據(jù)庫集群中,系統(tǒng)定時觸發(fā)程序每隔5分鐘啟動Hadoop MapReduce分析程序,分析結(jié)果通過GP進(jìn)行多維分析查詢展現(xiàn),當(dāng)系統(tǒng)出現(xiàn)操作異常或者是用戶違規(guī)操作時,立刻通過進(jìn)行系統(tǒng)操作告警。業(yè)務(wù)人員用戶可在Web操作界面通過SQL接口實(shí)時查詢應(yīng)用日志,實(shí)現(xiàn)對錯誤信息的實(shí)時定位。
在此系統(tǒng)架構(gòu)中,SequoiaDB巨杉數(shù)據(jù)庫發(fā)揮三大作用:
-
海量應(yīng)用日志的數(shù)據(jù)存儲:大量的原始日志保存到SequoiaDB數(shù)據(jù)庫中,并按時間、交易號兩個字段均勻的分布到五個節(jié)點(diǎn)服務(wù)器的各自數(shù)據(jù)磁盤中。由于SequoiaDB數(shù)據(jù)庫原生就支持?jǐn)?shù)據(jù)備份功能,保證數(shù)據(jù)安全的同時,解決了數(shù)據(jù)災(zāi)備問題。
-
向Hadoop提供分析的原始數(shù)據(jù):SequoiaDB數(shù)據(jù)庫能與Hadoop深度整合, MapReduce程序能無縫對接SequoiaDB數(shù)據(jù)源進(jìn)行高效的迭代計(jì)算,也可以通過Hive SQL對分布的日志數(shù)據(jù)進(jìn)行檢索,完成并行分布式計(jì)算。
-
實(shí)時SQL查詢:用戶在查詢某個交易號的明細(xì)日志,只需以SQL形式提交相應(yīng)的交易號,SequoiaDB數(shù)據(jù)庫即按索引機(jī)制進(jìn)行索引匹配,實(shí)時反饋出完整的日志報文,實(shí)現(xiàn)基于交易號的實(shí)時查詢,將處理流程大大簡化。
4.項(xiàng)目成果
智能運(yùn)維監(jiān)控
系統(tǒng)很好地滿足了對應(yīng)用日志數(shù)據(jù)的實(shí)時統(tǒng)計(jì)及異常檢測的功能需求。
實(shí)時統(tǒng)計(jì)
異常檢測
運(yùn)維簡單方便
相比起單純的HDFS文件系統(tǒng),SequoiaDB數(shù)據(jù)庫在實(shí)現(xiàn)了對應(yīng)用日志數(shù)據(jù)的集中統(tǒng)一存儲的同時,滿足了全量日志實(shí)時SQL查詢及向分析程序輸送數(shù)據(jù)的需求。
相比于引入HBase,Impala, Storm, Pig等框架的方法,基于SequoiaDB數(shù)據(jù)庫的方案運(yùn)維簡單,開發(fā)方便,管理快捷,功能完善。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:巨杉案例:基于日志的大數(shù)據(jù)運(yùn)維管理平臺
本文網(wǎng)址:http://www.ezxoed.cn/html/solutions/14019320041.html