一、會(huì)計(jì)數(shù)據(jù)處理發(fā)展歷程回顧
會(huì)計(jì)數(shù)據(jù)是對(duì)企業(yè)經(jīng)營(yíng)活動(dòng)過(guò)程中各種經(jīng)濟(jì)事項(xiàng)進(jìn)行記錄的符號(hào)。在對(duì)會(huì)計(jì)數(shù)據(jù)進(jìn)行采集、存儲(chǔ)、加工和傳遞等的過(guò)程中所采用的技術(shù)稱為會(huì)計(jì)數(shù)據(jù)處理技術(shù)。會(huì)計(jì)數(shù)據(jù)處理技術(shù)的發(fā)展經(jīng)歷了四個(gè)階段:
一是會(huì)計(jì)數(shù)據(jù)手工處理階段, 會(huì)計(jì)人員依靠算盤、紙張等計(jì)算工具對(duì)會(huì)計(jì)數(shù)據(jù)進(jìn)行采集、存儲(chǔ)、加工和具時(shí)會(huì)計(jì)數(shù)據(jù)進(jìn)行采集、存儲(chǔ)、加工和傳遞等。手工處理階段在會(huì)計(jì)業(yè)務(wù)處理過(guò)程中表現(xiàn)出好的適應(yīng)性、靈活性和可靠性,但也表現(xiàn)出低速度、低效率和高差錯(cuò)率等不足之處。
二是會(huì)計(jì)數(shù)據(jù)機(jī)械處理階段,即會(huì)計(jì)人員利用穿孔機(jī)、驗(yàn)孔機(jī)、機(jī)電設(shè)備、電子設(shè)備等工具對(duì)會(huì)計(jì)數(shù)據(jù)進(jìn)行采集、存儲(chǔ)、加工和傳遞等。會(huì)計(jì)數(shù)據(jù)機(jī)械處理階段能夠提高會(huì)計(jì)數(shù)據(jù)處理的計(jì)算速度與正確性,但這些工具存在體系龐大、成本過(guò)高、操作困難和穩(wěn)定性較差等不足。
三是會(huì)計(jì)數(shù)據(jù)電子計(jì)算機(jī)處理階段。計(jì)算機(jī)的出現(xiàn),為會(huì)計(jì)數(shù)據(jù)處理提供了技術(shù)支撐。會(huì)計(jì)數(shù)據(jù)的集中存儲(chǔ)和自動(dòng)處理極大地提高了會(huì)計(jì)數(shù)據(jù)處理的工作效率,提高了會(huì)計(jì)信息的及時(shí)性和準(zhǔn)確性。這個(gè)階段,計(jì)茸機(jī)技術(shù)還是會(huì)計(jì)數(shù)據(jù)處理的工具,信息的分享和交換主要通過(guò)軟盤、光盤等存儲(chǔ)介質(zhì)來(lái)實(shí)現(xiàn)。該階段會(huì)計(jì)核算和操作流程主要模擬手工方式,只有相關(guān)獨(dú)立的單機(jī)運(yùn)行的會(huì)計(jì)核算程序,一種核算程序獨(dú)立完成一項(xiàng)會(huì)計(jì)業(yè)務(wù),相互之間沒(méi)有聯(lián)系。
四是會(huì)計(jì)數(shù)據(jù)網(wǎng)絡(luò)化處理階段。隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,財(cái)務(wù)部門,可獨(dú)立使用計(jì)算機(jī)及網(wǎng)絡(luò)如內(nèi)部網(wǎng)(intranet)、外部網(wǎng)(extranet)、因特網(wǎng)(internet)等進(jìn)行會(huì)計(jì)數(shù)據(jù)的處理。
利用分布式數(shù)據(jù)庫(kù)技術(shù)、互聯(lián)網(wǎng)技術(shù)、中間件技術(shù)、系統(tǒng)集成技術(shù)等現(xiàn)代信息技術(shù),特別是ERP系統(tǒng)的開(kāi)發(fā)與應(yīng)用,企業(yè)會(huì)計(jì)信息系統(tǒng)實(shí)現(xiàn)了業(yè)務(wù)流程、會(huì)計(jì)工作流程和信息流程的集成,徹底消除了“信息孤島”現(xiàn)象,極大地提高了整個(gè)企業(yè)的信息共享性。同時(shí),實(shí)現(xiàn)了業(yè)務(wù)處理和會(huì)計(jì)處理的集成、財(cái)務(wù)信息和非財(cái)務(wù)信息的集成、會(huì)計(jì)核算與會(huì)計(jì)管理的集成。
二、物聯(lián)網(wǎng)下會(huì)計(jì)數(shù)據(jù)處理的革命
(一)會(huì)計(jì)大數(shù)據(jù)的特征
隨著信息技術(shù)特別是物聯(lián)網(wǎng)技術(shù)、移動(dòng)計(jì)算技術(shù)的發(fā)展,會(huì)計(jì)核算必須收集、處理數(shù)量巨大、結(jié)構(gòu)各異的大數(shù)據(jù)。這些會(huì)計(jì)大數(shù)據(jù)除具有一般大數(shù)據(jù)的4個(gè)“V”的特征外,還具有無(wú)形性與粘性的特征:
1.數(shù)據(jù)數(shù)童規(guī)模大(Volume)。物聯(lián)網(wǎng)下產(chǎn)生的數(shù)據(jù)數(shù)量大,它已經(jīng)不是過(guò)去大規(guī)模數(shù)據(jù)(large scale data)、龐大數(shù)據(jù)(enormous data)、海童數(shù)據(jù)(massive data)所能夠描述的,而應(yīng)該是用大數(shù)據(jù)(big data)來(lái)概括。數(shù)據(jù)規(guī)模不是用GB, TB為單位而是用PB為單位來(lái)衡量。
2.數(shù)據(jù)異構(gòu)的數(shù)據(jù)((Variety)。物聯(lián)網(wǎng)下產(chǎn)生的數(shù)據(jù)不僅包括數(shù)字這樣結(jié)構(gòu)化的數(shù)據(jù),還包括聲音、圖像等非結(jié)構(gòu)化的數(shù)據(jù)。這些數(shù)據(jù)因?yàn)榕c業(yè)務(wù)事件的關(guān)聯(lián)性,從而導(dǎo)致結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)更加復(fù)雜,不易處理。
3.數(shù)據(jù)產(chǎn)生與處理實(shí)時(shí)性( Velocity)。傳統(tǒng)數(shù)據(jù)時(shí)時(shí)間處理要求不高。但是,物聯(lián)網(wǎng)下物的行為與人的行為一般都要求在當(dāng)下完成,因此數(shù)據(jù)的產(chǎn)生與處理具有實(shí)時(shí)性。
4.價(jià)值密度低(Value)。會(huì)計(jì)大數(shù)據(jù)會(huì)連續(xù)不斷地產(chǎn)生,但有價(jià)值的數(shù)據(jù)卻只是連續(xù)產(chǎn)生的數(shù)據(jù)中的一個(gè)片斷或一個(gè)部分。以視頻為例,連續(xù)不間斷的監(jiān)控過(guò)程中,可能有用的數(shù)據(jù)僅僅只有一兩秒。因此,大數(shù)據(jù)的價(jià)值密度低。
5.會(huì)計(jì)數(shù)據(jù)的無(wú)形性與粘性。當(dāng)前物聯(lián)網(wǎng)上企業(yè)采集、傳輸、處理的數(shù)字信息主要是非價(jià)值的數(shù)量信息。這些數(shù)據(jù)可以直接被感應(yīng)器所感知,從而容易被傳播;而會(huì)計(jì)數(shù)據(jù)是無(wú)形的數(shù)據(jù),它不能夠被感應(yīng)器所感知。同時(shí),會(huì)計(jì)數(shù)據(jù)是直接粘合在業(yè)務(wù)數(shù)據(jù)之中,不能夠脫離業(yè)務(wù)數(shù)據(jù)而存在。因此,會(huì)計(jì)數(shù)據(jù)具有無(wú)形性與粘性。
(二)會(huì)計(jì)大數(shù)據(jù)的處理問(wèn)題:物聯(lián)網(wǎng)與云計(jì)算的發(fā)展必須解決的問(wèn)題
如果說(shuō)石油是工業(yè)社會(huì)的血液,那么數(shù)據(jù)就是信息社會(huì)中的血液。但是,大童的大數(shù)據(jù)如果沒(méi)有得到有效利用,就會(huì)產(chǎn)生數(shù)據(jù)泛濫或信息超載。大量?jī)?yōu)質(zhì)的數(shù)據(jù)和劣質(zhì)數(shù)據(jù)融合在一起,可能會(huì)產(chǎn)生各種各樣的誤差和錯(cuò)誤。數(shù)據(jù)不準(zhǔn)確就沒(méi)有任何價(jià)值。如何保證數(shù)據(jù)的可信性和質(zhì)童是物聯(lián)網(wǎng)需要解決的首要問(wèn)題。其次,如何時(shí)物聯(lián)網(wǎng)中所產(chǎn)生的大量數(shù)據(jù)進(jìn)行智能挖掘和分析以產(chǎn)生真正的數(shù)據(jù)價(jià)值是物聯(lián)網(wǎng)需要解決的核心問(wèn)題。最后,如何對(duì)由于物聯(lián)網(wǎng)所產(chǎn)生的大量大數(shù)據(jù)進(jìn)行存儲(chǔ)和管理并確保這些大數(shù)據(jù)的安全,是物聯(lián)網(wǎng)下需要解決的基礎(chǔ)問(wèn)題。
三、構(gòu)建會(huì)計(jì)大數(shù)據(jù)分析平臺(tái)及其思路:企業(yè)會(huì)計(jì)云計(jì)算建設(shè)的核心
隨著會(huì)計(jì)大數(shù)據(jù)時(shí)代的來(lái)臨,企業(yè)要向數(shù)據(jù)分析型企業(yè)轉(zhuǎn)型,必須改變傳統(tǒng)觀念,全員、全方位、全過(guò)程地利用數(shù)據(jù),建立會(huì)計(jì)大數(shù)據(jù)分析平臺(tái)。由于篇幅的限制,會(huì)計(jì)大數(shù)據(jù)的治理及管理、標(biāo)準(zhǔn)與安全管理等內(nèi)容不在本文論述,本文主要提出企業(yè)推行會(huì)計(jì)云計(jì)算、構(gòu)建會(huì)計(jì)大數(shù)據(jù)分析平臺(tái)中需要做到的幾點(diǎn)內(nèi)容。
(一)大數(shù)據(jù)不是信息,信息不是智慧:企業(yè)必須端正的認(rèn)識(shí)
由于數(shù)據(jù)蘊(yùn)含著企業(yè)管理決策所需要的信息,通過(guò)對(duì)企業(yè)所擁有的數(shù)據(jù)進(jìn)行分析,能夠?yàn)槠髽I(yè)創(chuàng)造巨大的效益,如對(duì)企業(yè)內(nèi)部數(shù)據(jù)進(jìn)行挖掘、優(yōu)化,能幫助企業(yè)更精準(zhǔn)地找到用戶、降低營(yíng)梢成本、提高企業(yè)銷售率、增加利潤(rùn)。因此,當(dāng)前許多企業(yè)認(rèn)為只要是數(shù)據(jù)就要收集、存儲(chǔ),就能夠從中獲取收益,這是一個(gè)錯(cuò)誤的認(rèn)識(shí)。數(shù)據(jù)越多,不一定代表信息越多。數(shù)據(jù)不代表信息,更不代表智慧。企業(yè)大量收集大數(shù)據(jù)的同時(shí),也面臨著大數(shù)據(jù)處理、使用、保管和安全等方面的新挑戰(zhàn)。當(dāng)前,許多企業(yè)有很多數(shù)據(jù)自收集后就存在服務(wù)器內(nèi),不產(chǎn)生任何價(jià)值。如銀行、電信、保險(xiǎn)等企業(yè)擁有巨量數(shù)據(jù),但有很大一部分?jǐn)?shù)據(jù)是處于休眠或者是半休眠狀態(tài),不僅未能幫助企業(yè)做出有效的管理決策,而且耗費(fèi)大量存儲(chǔ)和管理成本。
(二)確保會(huì)計(jì)大數(shù)據(jù)質(zhì)量:一個(gè)必須堅(jiān)持的原則
“垃圾的數(shù)據(jù)只能產(chǎn)生垃圾的信息。”在會(huì)計(jì)大數(shù)據(jù)處理過(guò)程中經(jīng)常出現(xiàn)數(shù)據(jù)不準(zhǔn)確、不完整、不及時(shí)等數(shù)據(jù)質(zhì)量問(wèn)題。因此,在會(huì)計(jì)數(shù)據(jù)處理的過(guò)程中必須確保會(huì)計(jì)大數(shù)據(jù)的質(zhì)量。
會(huì)計(jì)大數(shù)據(jù)的質(zhì)量主要包括大數(shù)據(jù)的準(zhǔn)確性、完整性、一致性、時(shí)效性、可信性和可解釋性等。數(shù)據(jù)的準(zhǔn)確性是指不包含錯(cuò)誤或存在偏離期望的值;數(shù)據(jù)的完整性是指數(shù)據(jù)不缺屬性值,或僅含聚集數(shù)據(jù);數(shù)據(jù)的一致性是指數(shù)據(jù)之間不存在差異,相互可內(nèi)洽;數(shù)據(jù)的時(shí)效性是指數(shù)據(jù)的及時(shí)性;數(shù)據(jù)的可信性是指反映有多少數(shù)據(jù)是用戶依賴的;數(shù)據(jù)可解釋性是指數(shù)據(jù)是否容易理解。
(三)建立企業(yè)大數(shù)據(jù)中心開(kāi)發(fā)平臺(tái):數(shù)據(jù)分析平臺(tái)建設(shè)的基礎(chǔ)
大數(shù)據(jù)的問(wèn)題不是單一的一個(gè)產(chǎn)品能夠解決的,它需要一整套的解決方案,它要融合很多傳統(tǒng)的、新的技術(shù)。要構(gòu)建大數(shù)據(jù)分析平臺(tái)并從大數(shù)據(jù)中挖掘出價(jià)值,企業(yè)首先需要一個(gè)可擴(kuò)展、靈活而可管理的數(shù)據(jù)基礎(chǔ)架構(gòu),也就是企業(yè)大數(shù)據(jù)中心開(kāi)發(fā)平臺(tái)。
1.數(shù)據(jù)中心開(kāi)發(fā)平臺(tái)的基本內(nèi)容。數(shù)據(jù)中心開(kāi)發(fā)平臺(tái)的含義很多,筆者認(rèn)為,數(shù)據(jù)中心主要應(yīng)具備以下特征:
①數(shù)據(jù)中心是各種數(shù)據(jù)的集成與交換中心,是集基礎(chǔ)與應(yīng)用為一體的綜合開(kāi)發(fā)與應(yīng)用集成平臺(tái)。
②數(shù)據(jù)中心是一種搭建平臺(tái),提供一系列完整語(yǔ)義的數(shù)據(jù)處理功能,提供對(duì)流程、表單、應(yīng)用程序界面數(shù)據(jù)等完整的搭建方案(由一系列的程序模塊及數(shù)據(jù)組成),因而也是關(guān)于應(yīng)用系統(tǒng)的集成設(shè)計(jì)器和工具箱。
③數(shù)據(jù)中心是一種強(qiáng)兼容性的數(shù)據(jù)倉(cāng)庫(kù),可以在同一個(gè)框架下,把來(lái)自不同生產(chǎn)廠商、不同格式、不同標(biāo)準(zhǔn)和分布在不同位置的數(shù)據(jù)統(tǒng)一在一個(gè)系統(tǒng)之下,即實(shí)現(xiàn)對(duì)分布式多源異構(gòu)數(shù)據(jù)的管理能力。
④數(shù)據(jù)中心是一個(gè)定義完備的功能倉(cāng)庫(kù),支持和管理以多種方式(組件、插件、流程、動(dòng)態(tài)庫(kù)、程序片斷和腳本)提供的功能,并能時(shí)這些功能以一種一致的方式進(jìn)行調(diào)用和執(zhí)行。
⑤數(shù)據(jù)中心是一種應(yīng)用集成系統(tǒng),采用柔性設(shè)計(jì)理念,系統(tǒng)能夠被快捷地搭建出來(lái),且能適應(yīng)需求的變化迅速做出調(diào)整。
2.數(shù)據(jù)中心的體系架構(gòu)。數(shù)據(jù)中心的架構(gòu)是面向服務(wù)的系統(tǒng)架構(gòu)(Service-Oriented Architecture),又稱為SOA架構(gòu)。在這架構(gòu)下,無(wú)數(shù)軟件制造者可將其研制軟件功能以服務(wù)形式提供出來(lái),各功能之間是相互獨(dú)立的,以一種稱為松藕合的協(xié)議機(jī)制來(lái)組合。數(shù)據(jù)中心架構(gòu)通過(guò)目錄配置、可視化配置和搭建充分利用功能倉(cāng)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)的機(jī)制進(jìn)行管理。
(四)會(huì)計(jì)大數(shù)據(jù)的獲取、存儲(chǔ)和計(jì)算:一條企業(yè)參與會(huì)計(jì)云計(jì)算的主線
1.數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)選擇、教據(jù)變換:會(huì)計(jì)大數(shù)據(jù)的獲取。
會(huì)計(jì)有一句名言:財(cái)務(wù)會(huì)計(jì)與管理會(huì)計(jì)影同源分流”,這里的源便是數(shù)據(jù)。但是,收集來(lái)的數(shù)據(jù)應(yīng)先經(jīng)過(guò)數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)選擇、數(shù)據(jù)變換才能進(jìn)行會(huì)計(jì)的加工、處理。首先,未經(jīng)處理會(huì)出現(xiàn)數(shù)據(jù)的不準(zhǔn)確,例如收集數(shù)據(jù)的設(shè)備可能出故障;人或計(jì)算機(jī)的錯(cuò)誤可能在數(shù)據(jù)輸入時(shí)出現(xiàn);用戶不希望提交個(gè)人信息時(shí),故意強(qiáng)制輸入不正確的值;錯(cuò)誤也可能在傳輸過(guò)程中出現(xiàn)。其次,未經(jīng)處理會(huì)出現(xiàn)數(shù)據(jù)的不完整。不完整數(shù)據(jù)的出現(xiàn)可能出于多種原因,如銷售事務(wù)數(shù)據(jù)中顧客的數(shù)據(jù)不一定總能得到;數(shù)據(jù)的重復(fù),如多次記入的客戶;數(shù)據(jù)邏輯上關(guān)聯(lián)不一致,如地址與郵政編碼。
會(huì)計(jì)數(shù)據(jù)預(yù)處理主要有數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)選擇、數(shù)據(jù)變換。有效的“清理”是指消除噪音和刪除不一致數(shù)據(jù);集成是指多種數(shù)據(jù)源可組合在一起;選擇是指從數(shù)據(jù)庫(kù)中提取與分析任務(wù)相關(guān)的數(shù)據(jù);變換是指通過(guò)匯總或聚集操作,把數(shù)據(jù)變換和統(tǒng)一成適合挖掘的形式。
2.關(guān)系型數(shù)據(jù)庫(kù)存儲(chǔ)與管理向本原(XML)數(shù)據(jù)庫(kù)存儲(chǔ)與管理轉(zhuǎn)變:會(huì)計(jì)大數(shù)據(jù)的存儲(chǔ)與管理。
數(shù)據(jù)的存儲(chǔ)與計(jì)算是相互依存的。因此,會(huì)計(jì)大數(shù)據(jù)的存儲(chǔ)在會(huì)計(jì)云計(jì)算中具有重要的地位。隨著會(huì)計(jì)大數(shù)據(jù)時(shí)代的來(lái)臨,會(huì)計(jì)數(shù)據(jù)已從原來(lái)數(shù)值型為主的數(shù)據(jù)向非結(jié)構(gòu)性為主的數(shù)據(jù)轉(zhuǎn)變。由于非結(jié)構(gòu)性數(shù)據(jù)存儲(chǔ)與結(jié)構(gòu)性數(shù)據(jù)存儲(chǔ)技術(shù)上存在本質(zhì)的差異,會(huì)計(jì)大數(shù)據(jù)的存儲(chǔ)與管理要從關(guān)系型數(shù)據(jù)庫(kù)存儲(chǔ)與管理向本原(XML)數(shù)據(jù)庫(kù)存儲(chǔ)與管理轉(zhuǎn)變。
①關(guān)系型數(shù)據(jù)庫(kù)存儲(chǔ)與管理。關(guān)系型數(shù)據(jù)庫(kù)存儲(chǔ)與管理不僅很好地解決了數(shù)據(jù)的集中和共享問(wèn)題,而且數(shù)據(jù)關(guān)系模型有嚴(yán)格的數(shù)學(xué)基礎(chǔ),抽象級(jí)別比較高,而且簡(jiǎn)單清晰,便于理解和使用。關(guān)系型數(shù)據(jù)庫(kù)也能夠解決數(shù)據(jù)獨(dú)立性和抽象問(wèn)題。用戶在對(duì)這種數(shù)據(jù)庫(kù)進(jìn)行存取時(shí),不需要明確數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)并指出存取路徑。
②原生XML數(shù)據(jù)庫(kù)系統(tǒng)(Native XML Database)存儲(chǔ)與管理。關(guān)系型數(shù)據(jù)庫(kù)能很好地處理所謂的“表格型數(shù)據(jù)”,卻對(duì)物聯(lián)網(wǎng)技術(shù)所產(chǎn)生的非結(jié)構(gòu)化的數(shù)據(jù)無(wú)能為力。這就需要比關(guān)系型數(shù)據(jù)庫(kù)產(chǎn)品更高級(jí)的面向?qū)ο箨P(guān)系型數(shù)據(jù)庫(kù)來(lái)支持(作者注:“面向?qū)ο蟮臄?shù)據(jù)庫(kù)系統(tǒng)<objectoriented database>"<或簡(jiǎn)稱“OO數(shù)據(jù)庫(kù)系統(tǒng)”>專門用來(lái)解決非結(jié)構(gòu)化的數(shù)據(jù)存儲(chǔ)問(wèn)題。由于面向?qū)ο蟮臄?shù)據(jù)庫(kù)產(chǎn)品的主要設(shè)計(jì)思想是試圖用新型數(shù)據(jù)庫(kù)系統(tǒng)來(lái)取代現(xiàn)有的數(shù)據(jù)庫(kù)系統(tǒng),這對(duì)許多已經(jīng)運(yùn)用數(shù)據(jù)庫(kù)系統(tǒng)多年兼積累了大量工作數(shù)據(jù)的客戶<尤其是大客戶>來(lái)說(shuō),無(wú)法承受新舊數(shù)據(jù)間的轉(zhuǎn)換而帶來(lái)的巨大工作量及巨額開(kāi)支。
另外,面向?qū)ο蟮年P(guān)系型數(shù)據(jù)庫(kù)系統(tǒng)使查詢語(yǔ)言變得極其復(fù)雜,從而使得無(wú)論是數(shù)據(jù)庫(kù)的開(kāi)發(fā)商家還是應(yīng)用客戶都視其復(fù)雜的應(yīng)用技術(shù)為畏途。因此,面向?qū)ο笈c關(guān)系型數(shù)據(jù)庫(kù)的結(jié)合是當(dāng)前的主要方式)。以非結(jié)構(gòu)化數(shù)據(jù)為主要特征的會(huì)計(jì)大數(shù)據(jù)存儲(chǔ)與管理必須在跨操作平臺(tái)、跨軟件系統(tǒng)的Internet平臺(tái)上進(jìn)行,其基礎(chǔ)技術(shù)就形可擴(kuò)展的標(biāo)識(shí)語(yǔ)言(XML, extensiblemarkup language)。如果說(shuō)以http傳輸協(xié)議和超文本標(biāo)識(shí)語(yǔ)言HTML為標(biāo)志的是第一代Internet技術(shù)的話,那么,圍繞著XML所形成的一系列標(biāo)準(zhǔn)和技術(shù)將構(gòu)成新一代的Internet技術(shù)。HTML文件中的標(biāo)識(shí)符僅表示該文件應(yīng)該如何顯示,文件中表達(dá)的意義完全需要人通過(guò)對(duì)文字的閱讀才能理解,機(jī)器難以判斷其表達(dá)的語(yǔ)義。而XML則不同,它所采用的標(biāo)識(shí)符本身就代表了語(yǔ)義結(jié)構(gòu),文件的具體語(yǔ)義完全可以通過(guò)對(duì)語(yǔ)義結(jié)構(gòu)的分解及該結(jié)構(gòu)內(nèi)變量值或字符的分析由機(jī)器來(lái)解釋。因此,用通俗的話來(lái)概括HTML與XML的差別:0HTML是寫(xiě)給人看的;而XML則是寫(xiě)給機(jī)器看的。
一般說(shuō)來(lái),XML有下列重要特性:XML是一種表意而非表形的元語(yǔ)言;XML是Internet的標(biāo)準(zhǔn)語(yǔ)言,具有跨操作平臺(tái)、跨區(qū)域的特點(diǎn),是網(wǎng)絡(luò)世界里的一種“世界語(yǔ)”;XML是一種可自我描述定義的元語(yǔ)言(self descriptionmeta language),所以它將大量用于制定行業(yè)內(nèi)及行業(yè)間數(shù)據(jù)交換的標(biāo)準(zhǔn)。相對(duì)于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng)來(lái)說(shuō),原生XML數(shù)據(jù)庫(kù)系統(tǒng)存儲(chǔ)與管理是一種結(jié)構(gòu)完全不同、設(shè)計(jì)思想新穎的全新的數(shù)據(jù)庫(kù)系統(tǒng)。如果用關(guān)系型數(shù)據(jù)庫(kù)來(lái)處理XML數(shù)據(jù),將需要一系列復(fù)雜的轉(zhuǎn)換工作,從而極大地影響應(yīng)用的速度。當(dāng)轉(zhuǎn)換選擇不合理時(shí),很有可能對(duì)應(yīng)用造成致命的傷害。而原生XML數(shù)據(jù)庫(kù)系統(tǒng)則不同,XML數(shù)據(jù)不經(jīng)任何轉(zhuǎn)換而按原結(jié)構(gòu)形狀直接存入數(shù)據(jù)庫(kù)內(nèi)。時(shí)于XML應(yīng)用,原生XML數(shù)據(jù)庫(kù)系統(tǒng)的速度相對(duì)于其他數(shù)據(jù)庫(kù)來(lái)說(shuō)要快得多。
3.數(shù)據(jù)挖掘:會(huì)計(jì)大數(shù)據(jù)的計(jì)算。
從某種意義上說(shuō),會(huì)計(jì)實(shí)質(zhì)上是數(shù)據(jù)分類處理的一門學(xué)問(wèn)。如何從經(jīng)濟(jì)業(yè)務(wù)數(shù)據(jù)中獲取決策知識(shí)是會(huì)計(jì)的主要目的。隨著信息技術(shù)的發(fā)展,數(shù)據(jù)挖掘技術(shù)正是會(huì)計(jì)大數(shù)據(jù)處理的核心技術(shù)。數(shù)據(jù)挖掘(Data mining)主要是指從數(shù)據(jù)庫(kù)中提取知識(shí),并對(duì)數(shù)據(jù)進(jìn)行一定的處理,從而獲得其中隱含的、事先未知的而又可能極為有用的信息。數(shù)據(jù)挖掘方法主要包括神經(jīng)網(wǎng)絡(luò)法、遺傳算法、決策樹(shù)法、搜蓋正例排斥反例法、統(tǒng)計(jì)分析法、模糊集法等。
數(shù)據(jù)挖掘的主要內(nèi)容可分為四類,即預(yù)測(cè)建模、關(guān)聯(lián)分析、聚類分析和異常檢測(cè)等。這里主要把它分為兩類:預(yù)測(cè)任務(wù)與描述任務(wù)。預(yù)測(cè)任務(wù)是指根據(jù)其他屬性的值,預(yù)測(cè)特定屬性的值;描述任務(wù)主要是導(dǎo)出概括數(shù)據(jù)中潛在聯(lián)系的模式(如相關(guān)、趨勢(shì)、聚類、軌跡和異常)。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.ezxoed.cn/
本文標(biāo)題:構(gòu)建會(huì)計(jì)大數(shù)據(jù)分析平臺(tái) 企業(yè)會(huì)計(jì)云計(jì)算建設(shè)的核心
本文網(wǎng)址:http://www.ezxoed.cn/html/consultation/1083979825.html