隨著信息技術特別是信息通訊技術的發(fā)展,互聯(lián)網、社交網絡、物聯(lián)網、移動互聯(lián)網、云計算等相繼進入人們的日常工作和生活中,全球數(shù)據(jù)信息量呈指數(shù)式爆炸增長之勢。根據(jù)國際數(shù)據(jù)公司IDC發(fā)布的研究報告,預計全球數(shù)據(jù)量大約每兩年翻一番,到2020年全球將達到35ZB的數(shù)據(jù)信息量。隨著前所未有巨量數(shù)據(jù)信息的聚集, “大數(shù)據(jù)”已得到廣泛關注。本文將分企業(yè)數(shù)據(jù)、機器數(shù)據(jù)和社會化數(shù)據(jù)三類,針對企業(yè)數(shù)據(jù)處理面臨的挑戰(zhàn)、機器數(shù)據(jù)應用場景、社會化數(shù)據(jù)帶來的變革展開討論。
1、企業(yè)數(shù)據(jù)處理面臨的挑戰(zhàn)
中國的企業(yè)已經認識到大數(shù)據(jù)蘊含著巨大的商業(yè)價值,但國內互聯(lián)網巨頭作為率先使用大數(shù)據(jù)技術的用戶,僅僅是基于開源軟件自主開發(fā)大數(shù)據(jù)應用,未形成企業(yè)級的個性化應用。
(1)非結構化和結構化數(shù)據(jù)的統(tǒng)一及整合
隨著互聯(lián)網和通信技術的迅猛發(fā)展,企業(yè)中的數(shù)據(jù)類型早已不是單一的以文本為主的結構化數(shù)據(jù),還充斥著廣泛存在于社交網絡、物聯(lián)網、電子商務等之中的網絡日志、音頻、視頻、圖片、地理位置信息等多類型的數(shù)據(jù)。這些數(shù)據(jù)稱為非結構化數(shù)據(jù)。據(jù)統(tǒng)計,企業(yè)中85%的數(shù)據(jù)屬于非結構化數(shù)據(jù)。但是企業(yè)現(xiàn)有的數(shù)據(jù)處理方法僅適用于結構化數(shù)據(jù),無法將大量的非結構化數(shù)據(jù)與結構化數(shù)據(jù)進行統(tǒng)一、整合,就無法發(fā)掘數(shù)據(jù)中的價值。
(2)跨業(yè)務平臺數(shù)據(jù)的關聯(lián)
當今企業(yè)環(huán)境中存在著:不同業(yè)務模塊的數(shù)據(jù)分布在不同的系統(tǒng)平臺,這些被割裂的數(shù)據(jù)在單一業(yè)務平臺無法得到有效利用;不同業(yè)務模塊的數(shù)據(jù)無法實現(xiàn)共享、關聯(lián);僅對關鍵業(yè)務的數(shù)據(jù)進行收集、整合和利用,非關鍵業(yè)務的數(shù)據(jù)被忽視等現(xiàn)狀。企業(yè)中的數(shù)據(jù)由于業(yè)務模塊的劃分而被割裂開來.單一業(yè)務模塊的數(shù)據(jù)價值遠遠小于所有業(yè)務模塊數(shù)據(jù)關聯(lián)起來進行分析運用,企業(yè)將如何實現(xiàn)跨業(yè)務平臺數(shù)據(jù)的關聯(lián)與整合將面臨巨大的挑戰(zhàn)。
(3)面向數(shù)據(jù)的實時分析
隨著經濟的飛速發(fā)展,企業(yè)所面臨的市場行情也在瞬息萬變,企業(yè)曾經慣用的事后處理機制已經不能應對,企業(yè)需要實時洞察業(yè)務運營狀態(tài),以便迅速應對不斷變化的市場形勢。
企業(yè)業(yè)務的運營狀態(tài)將體現(xiàn)在海量數(shù)據(jù)的快速處理和有效進行實時分析的基礎上。但隨著大數(shù)據(jù)的爆炸式增長,與企業(yè)相關的數(shù)據(jù)可能在無限量的不斷增長,這些不斷變化的數(shù)據(jù),需要企業(yè)進行全面、實時的分析。
(4)數(shù)據(jù)驅動的戰(zhàn)略決策
社交網絡、移動互聯(lián)網、企業(yè)信息化近幾年迅猛發(fā)展,不斷產生的海量數(shù)據(jù)將越來越影響企業(yè)從戰(zhàn)術到戰(zhàn)略制定的各個方面。麻省理工學院斯隆管理學院教授Erik Brynjolfsson表示,基于數(shù)據(jù)分析的決策實現(xiàn)的生產率增長,要比任何其他因素5%-6%。這種生產率增長能夠決定大多數(shù)行業(yè)的勝負。
企業(yè)決策行為將基于數(shù)據(jù)和分析而做出,而非基于經驗和直覺,這對于企業(yè)是一個巨大的挑戰(zhàn)。
2、機器數(shù)據(jù)應用場景分析
機器數(shù)據(jù)是由機器產生的數(shù)據(jù),也是大數(shù)據(jù)最原始的數(shù)據(jù)類型,包括了日志文件、各種歷史記錄、Web服務器日志等。它們會由網絡交換機、企業(yè)應用系統(tǒng)、網絡以及安全設備等產生。
龐大的數(shù)據(jù)資源使得各個領域開始了量化進程,無論而對物聯(lián)網、電子商務、醫(yī)療,還是電信、金融領域,在大數(shù)據(jù)時代,滿足機器數(shù)據(jù)存儲、管理、檢索、分析、可視化等應用需求,結合IT運維、系統(tǒng)安全、搜索引擎、電子商務等特定應用的需求實現(xiàn)大數(shù)據(jù)環(huán)境下機器數(shù)據(jù)的存儲、管理、檢索和分析。
(1)IT運營管理
大數(shù)據(jù)時代,面對日益膨脹增長的數(shù)據(jù)與IT系統(tǒng),如何提高IT運維管理水平,降低IT運營的風險,保障業(yè)務正常、高效運行,已經成為大家越來越關注的焦點。實現(xiàn)機器數(shù)據(jù)良好的IT運營管理,包括:
統(tǒng)一管理:實現(xiàn)日志的統(tǒng)一收集、集中檢索與分析,對各種設備、操作系統(tǒng)、應用的日志進行統(tǒng)一的實時監(jiān)測與可視化分析:通過海量日志快速分析與檢索系統(tǒng),協(xié)助管理員快速發(fā)現(xiàn)、關注與定位事件;及時發(fā)現(xiàn)設備運行異常情況,并第一時間通過郵件或短信通知管理員,為排查故障爭取時間。
關聯(lián)分析:分析故障發(fā)生前后,所有相關IT設備、系統(tǒng)、應用的非正常運行狀態(tài),發(fā)現(xiàn)可疑的關聯(lián)問題;對系統(tǒng)的非正常運行狀態(tài)進行分析,挖掘日志內容之間的關聯(lián)性,定期生成相應的關聯(lián)分析圖、聚類分析圖等日志分析圖譜:系統(tǒng)自帶一些分析規(guī)則,將這些分析規(guī)則的分析結果推薦給用戶,為用戶的決策提供參考意見。
(2)IT系統(tǒng)安全和日志審計
政府機構經過多年信息化建設,為方便業(yè)務開展和更好的服務民眾,在系統(tǒng)內搭建了多個應用系統(tǒng),但各類數(shù)據(jù)庫和信息資源在方便開展業(yè)務的同時,數(shù)據(jù)信息的安全、違規(guī)操作、異常訪問等問題日益突出,個別事件還在社會上產生較大的負面影響。
實現(xiàn)機器數(shù)據(jù)的IT系統(tǒng)安全,包括:
基于敏感信息的用戶行為檢測:基于關鍵字的敏感信息定義:預先定義一組敏感信息關鍵字,系統(tǒng)對日志的用戶訪問行為進行掃描和檢測,如果發(fā)現(xiàn)某個用戶查詢了系統(tǒng)預先定義的關鍵字,則認為該用戶訪問了敏感信息:基于工作角色與數(shù)據(jù)資源匹配的敏感信息定義:對系統(tǒng)內的用戶進行工作角色定義,每個角色授予一定的數(shù)據(jù)資源訪問權限。如果發(fā)現(xiàn)某個用戶訪問的數(shù)據(jù)資源超出了其工作角色限定的范圍,訪問的信息與工作范圍不匹配,則可認為是訪問敏感信息。
用戶異常訪問行為自動檢測:通過對用戶異常訪問行為的檢測,識別非法訪問行為。監(jiān)測登錄時間異常:例如發(fā)現(xiàn)非工作時間訪問,或長期不活躍,某段時間突然活躍訪問敏感信息:監(jiān)測登錄地點異常:例如發(fā)現(xiàn)非習慣工作地點的異常伸地址訪問:監(jiān)測訪問行為異常:短時間內大數(shù)據(jù)量訪問,類似下載行為或機器爬蟲訪問行為:持續(xù)訪問敏感信息:短時間、持續(xù)訪問敏感信息。
(3)用戶行為分析
機器數(shù)據(jù)應用之——基于用戶行為分析的業(yè)務創(chuàng)新,用戶分析包括了用戶來源統(tǒng)計、訪問量統(tǒng)計、訪問軌跡分析、網站用戶流失原因分析等。大數(shù)據(jù)的預測能力正在被探索,機器數(shù)據(jù)的用戶行為分析讓精細衡量成為可能。
用戶來源統(tǒng)計:包括用戶的IP、來源地區(qū)、來路域名和頁面;訪客操作系統(tǒng)、游覽器等信息;Robots/Spiders的統(tǒng)計:對不同文件類型的統(tǒng)計信息。
訪問量統(tǒng)計:包括訪問量/訪問次數(shù)/頁面瀏覽量/點擊數(shù)/數(shù)據(jù)流量等:用戶在不同時段的訪問量情況,精確到每月、每日、每小時的數(shù)據(jù);用戶在網站的停留時間、跳出率、回訪者、新訪問者、回訪次數(shù)、回訪相隔天數(shù);注冊用戶和非注冊用戶,分析兩者之間的瀏覽習慣。
訪問軌跡分析:分析用戶的訪問路徑,發(fā)現(xiàn)最常訪問的路徑,進行網站路徑優(yōu)化。
網站用戶流失原因分析:找到系統(tǒng)里最近一批非活躍用戶(先前活躍,但某個時間點后較長時間不訪問本系統(tǒng)):對該組用戶的最近訪問軌跡進行關聯(lián)規(guī)則挖掘,挖掘訪問規(guī)律;根據(jù)訪問規(guī)律分析流失原因:某個頁面或功能的不可用或不友好。
以上的用戶分析,可以應用在各個領域,例如可以實現(xiàn)搜索引擎優(yōu)化、文檔推薦應用、社交網絡的文檔推薦與人物推薦、電子商務推薦引擎的相關工作、招聘網站的推薦引擎、其他用戶行為分析等。
3、社會化數(shù)據(jù)驅動市場調研和營銷變革
隨著社交網絡的流行,國內外社會化媒體得到了迅猛發(fā)展。集中在社會化媒體上龐大的用戶群及發(fā)生的用戶行為將會產生巨量的數(shù)據(jù)回饋,這些包括評論、視頻、照片、地理位置、個人資料、社交關系等由用戶在社會化媒體中產生或分享的各類信息即為社會化數(shù)據(jù)。
社會化數(shù)據(jù)與以前采集的靜態(tài)的、事務性數(shù)據(jù)完全不一樣,它具有實時性和流動性。人們在社會化媒體上通過交流、購買、出售和其他日常生活活動以免費的方式提供著大量信息。這些數(shù)據(jù)由每個網民的微行為匯集而成,蘊含著巨大的價值,將帶來企業(yè)在市場調研和營銷方面的變革。
(1)數(shù)據(jù)支撐“智慧”的市場調研
傳統(tǒng)的市場調研是根據(jù)提前設計好的調查問卷來搜集市場資料,這種方式具有很大的局限性。社會化媒體的流行,使社會化媒體平臺上匯集了龐大的的用戶群。如此巨大的用戶群及其產生的大量用戶行為為市場調研提供了大量的一手資源,為企業(yè)提供了分析消費者群體特征的機會。
社會化媒體天生的開放性,使消費者獲得了更多的話語權,消費者在社會化媒體上自愿的表達自己的想法,消費者在社會化媒體上談論的話題面非常廣,不僅局限于調查問卷中的話題,而且這些話題充斥著情感因素。這樣一方面使市場調研人員獲取了大量來自于消費者的一手資源;另一方面彌補了市場問卷由于提前設定問題而存在的局限性。同時,社會化數(shù)據(jù)的實時性,使市場調研人員可以在第一時間確認理解和追蹤消費者的反饋,制定更科學的營銷決策,從而發(fā)起合適的營銷活動。
(2)數(shù)據(jù)帶來市場營銷的掘金潮
國內社交網絡市場規(guī)模龐大并正快速增長,F(xiàn)在幾乎所有文章、廣告、視頻都鼓勵用戶進行社交分享及評論,我們已經進入社交網絡爆炸發(fā)展的時代。
社交網絡在全球的火爆,社會化媒體迅猛的發(fā)展、導致了整個用戶市場環(huán)境的變化。用戶接觸和獲取信息的渠道和方式、用戶與商家產生交互及購買行為的渠道和方式、用戶之間產生交流和分享體驗的渠道和方式都在發(fā)生全面而深刻的變化,用戶已經從以信任由生產商、渠道商、傳統(tǒng)媒體所構建的垂直信息渠道,轉變?yōu)楦敢庀嘈艁碜耘笥鸦蚰吧W友口口相傳的水平信息渠道,用戶已經從原來簡單同質化的物質需求發(fā)展為個性化的需求,用戶變得更加主動和理性。
用戶已經遷移到社會化媒體,傳播路徑在泛化,用戶行為在變化,企業(yè)不僅發(fā)現(xiàn)了潛在的危機,同時隨著社會化數(shù)據(jù)積聚增加,企業(yè)也發(fā)現(xiàn)了以社會化數(shù)據(jù)為支撐的市場營銷蘊含的巨大價值。
用戶在線社交生活中所發(fā)生的行為軌跡和所創(chuàng)造的內容尤為珍貴。社會化數(shù)據(jù)使得人們的行為和情緒的細節(jié)化測量成為可能。挖掘用戶的行為習慣和喜好,從凌亂紛繁的數(shù)據(jù)背后找到更符合用戶興趣和習慣的產品和服務,并對產品和服務進行針對性地調整和優(yōu)化,社會化數(shù)據(jù)將為企業(yè)市場營銷帶來巨大的價值。
核心關注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務領域、行業(yè)應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業(yè)務領域的管理,全面涵蓋了企業(yè)關注ERP管理系統(tǒng)的核心領域,是眾多中小企業(yè)信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.ezxoed.cn/
本文標題:大數(shù)據(jù)的應用及帶給企業(yè)的挑戰(zhàn)
本文網址:http://www.ezxoed.cn/html/consultation/10839314491.html