| 當前位置：拓步ERP資訊網(wǎng) >>服務支持 >>ERP技術支持 >>企業(yè)管理知識庫

淺析檔案序列化存儲管理

發(fā)布日期：2013-01-15 10:53:06 來源：www.ezxoed.cn 編輯：拓步ERP資訊網(wǎng) 瀏覽：評論

摘要：檔案管理工作具有重大的意義，但是目前檔案管理工作在信息化進程中遇到了大量的問題。使用檔案序列化存儲可以有效解決這些問題，本文討論了檔案信息化所遭遇的問題，以及檔案序列化存儲技術的應用前景和使用困難。 原標題：淺析檔案序列化存儲管理 原作者：發(fā)表時間：2013/1/15 杜健為來源：萬方數(shù)據(jù)

檔案管理工作具有重大的意義，但是目前檔案管理工作在信息化進程中遇到了大量的問題。使用檔案序列化存儲可以有效解決這些問題，本文討論了檔案信息化所遭遇的問題，以及檔案序列化存儲技術的應用前景和使用困難。

一、檔案序列化存儲研究的背景

檔案管理系統(tǒng)是整個國家文獻信息系統(tǒng)的組成部分之一，在構成整個社會的科學能力中占有重要地位，成為社會信息系統(tǒng)的基石。檔案管理不僅對各具體單位的工作和生產(chǎn)有意義，對整個社會而言，也很有意義，不僅具有當前的、現(xiàn)實的意義，也具有長遠的、歷史的意義。目前有充分的證據(jù)顯示，隨著科技水平的進步，檔案管理工作必須要隨之利用科學的武器武裝自己，加快檔案信息化管理的步伐，才能更好地發(fā)揮檔案管理工作在社會中的作用。

在檔案信息化進程中，很多檔案工作者發(fā)現(xiàn)了這樣的困難，即信息化后的檔案存儲往往呈現(xiàn)碎片狀，難以建立起一個相對完整的數(shù)據(jù)結構。尤其是面對海量數(shù)據(jù)的檔案，例如某些大型國有企業(yè)的檔案庫中，大量的檔案在邏輯上緊密相鄰，但是在物理上卻分散在存儲設備的不同位置，這種數(shù)據(jù)結構對于檔案的管理和檢索是十分不利的。大量的反饋信息反映出這樣一個現(xiàn)實：每年有大量的資源被浪費在了對于分散數(shù)據(jù)的檢索上。筆者結合實際以及其他學科的經(jīng)驗，提出了一種序列化存儲并管理檔案的方式，并對這種方式進行了檢驗。

二、序列化存儲基本原理

計算機科學中所討論的序列化(Serialization)，其真實含義為將對象的狀態(tài)信息轉換為可以存儲或傳輸?shù)男问降倪^程。舉例而言，對于一條復雜的數(shù)據(jù)，假定該數(shù)據(jù)牽扯到五個以上的表。如果我們使用傳統(tǒng)的數(shù)據(jù)庫存儲方式，數(shù)據(jù)將會呈現(xiàn)出四個或者更多的斷點。每次查找，都需要調用包含下列語句的程序：

USE數(shù)據(jù)庫名

SELECT表名．信息FROM表1表2

WHERE條件

按照這種方式，每一次的查找，都至少需要調用一次表查詢和一次表內檢索。假如一次查詢需要同時使用四個表，那么實際上需要調用的表查詢次數(shù)至少為三，表內檢索次數(shù)至少為四。這個結論的得出前提是每個表只需要使用一次。事實上，如果在數(shù)據(jù)庫建表時，數(shù)據(jù)庫已經(jīng)優(yōu)化到了BC范式，每個表很難做到只被調用一次。如果使用序列化的技術，所有的表項，也就是一個數(shù)據(jù)實體將會被表現(xiàn)成為一段序列化的代碼，通過對代碼的掃描，可以在一次檢索中完成對數(shù)據(jù)的增添、刪除、修改以及查詢。

目前在實際應用中的序列化大部分是在一些程序中的某些過程中使用的，在這些過程中，使用各種語言編輯的對象經(jīng)過序列化得到了可以直接掃描讀取的序列信息。但是顯而易見，序列化技術可以不經(jīng)改變地用來對數(shù)據(jù)進行存儲，并有著目前常用的檔案信息化管理方法難以比擬的優(yōu)勢。

假設有一條人事檔案，某同志部分基本情況如下：

姓名：張民性別：男民族：漢政治面貌：中共黨員

在傳統(tǒng)的情況下，我們需要建立一個數(shù)據(jù)表，這個表至少應該有四項，每一項對應一類情況。如果在XML文件下，我們需要為張民創(chuàng)建一個單獨的標記。如圖1所示：

圖1：XML文件保存的檔案條目

可能有檔案工作者提出質疑，序列化的檔案條目目前沒有體現(xiàn)出優(yōu)勢。但是試想一下，如果檔案條目的內容增加，形成了多表存儲，那么XML的簡單樹形存儲結構就顯示出了優(yōu)勢。序列化的XML文件可以被多種平臺以及軟件API直接讀取，極大地拓展了存儲內容的可用性。

三、一種改進的檔案序列化存儲方案

上文主要介紹了XML文件對于要保存的內容的序列化存儲，但是XML文件有著自身固有的弱點。如果數(shù)據(jù)量非常大，把全部的檔案內容保存在XML文件中，使用起來確實方便許多，但是如果在缺乏相應工具的時候，內容檢索就比較困難。在本節(jié)中，筆者提出一種改進的檔案序列化存儲方案設想，有充足證據(jù)顯示，這種設想如果可以被付諸實踐并不斷完善，那么將會給檔案管理工作帶來一次革命。

這種方案的核心思想是使用特征值將一條檔案序列化成為一個簡單字符串，字符串的不同位置被預先賦予特定的含義，這樣通過一次線性掃描可以獲知檔案條目的全部內容。下面的例子可以簡要地說明這種方案的思想。

設想一條檔案的前12位是如下的一串數(shù)字：223729014610。如果不加以說明，很難有人可以理解到這12位數(shù)字的含義。事實上，這是姓名代碼解決方案下的筆者的姓名代碼。在我國目前的高考中通用的姓名代碼收錄了7000個以上的姓名常用漢字，每一個漢字由4位數(shù)字形成的代碼表示。這樣，不同的人名可以經(jīng)過這一次的轉換，序列化成為一個12位的字符串。如果我們約定，每一條人事檔案的前12位代表姓名，那么每次檢索姓名時，只需要檢索每一條檔案的前12位即可。

同樣，我們可以規(guī)范檔案的內容，從而進一步規(guī)定，每一條序列化的檔案記錄的固定位置記錄固定內容，不同的信息也同樣設置類似于姓名代碼解決方案的對應標準，那么我們就可以做到由一個簡單字符串代表很豐富的信息。雖然目前并沒有應用于檔案管理，這種序列化方案在很多領域有著廣泛的應用，包括但不限于生物、醫(yī)學、機械、統(tǒng)計等。經(jīng)過序列化之后，原本復雜的、可能牽扯幾十個表的復雜數(shù)據(jù)庫將會在一個文件中簡單明了地標示清楚。并且，序列化的內容在對檔案的進一步利用上會有更加優(yōu)越的特質，在本文的最后一部分將會介紹。

本文所討論的這種檔案序列化存儲技術推廣的阻礙主要有三個：首先，檔案本身難以規(guī)范，導致不同地區(qū)、不同級別的檔案序列長度很難保持一致，對于檢索有不可忽視的阻礙作用。第二，檔案序列化標準難以出臺。我們很難做到在全國范圍內，以同一個方式，將檔案內容完全以姓名代碼解決方案的形式轉變?yōu)樽址蛘咦址�，而這個轉變(事實上就是序列化)過程恰恰就是這種技術轉化為實用的門檻。這個轉化賦值必須像《漢語拼音方案》一樣全國通用，所以這個轉化復制過程也必須由權威機構主管，并且調試之后全國同行業(yè)統(tǒng)一使用。第三，檢索工具的缺失導致目前這種技術難以為普通檔案工作者使用。不過，筆者個人認為技術難度相對而言最為簡單，相關工具技術含量并非很高，在明確需求之后兩個星期內筆者本人即可開發(fā)出有實用價值的工具。

四、序列化后的檔案信息的深入挖掘

上文說到，序列化之后的檔案信息可以直接利用于各種軟件和API，這為檔案進行數(shù)據(jù)挖掘提供了基礎。數(shù)據(jù)挖掘是對大規(guī)模數(shù)據(jù)的分析分類的過程，序列分類作為數(shù)據(jù)挖掘的重要分支，具有十分廣泛的應用前景，其應用范圍包括但不限于基因分析、信息檢索、健康監(jiān)測、金融預測等領域。不同的序列分類器在面對不同特征的序列時，往往具有不同但是良好的分類效果。僅舉一例，美國最大的零售商在對全年的銷售單據(jù)進行了數(shù)據(jù)挖掘之后，發(fā)現(xiàn)了嬰兒用品和酒精類飲料的銷售關系，于是將兩類商品放置在一起，第二年兩類商品的銷售量都有大幅提升。

檔案作為一類海量數(shù)據(jù)，具有極高的數(shù)據(jù)挖掘價值，統(tǒng)計學家和計算科學家們相信，對于檔案進行數(shù)據(jù)挖掘，可以得到很多有意義的數(shù)據(jù)和結果。例如，從事機械設計工作的工程師可能會更具語言天賦，小學時受到過獎勵的學生在長大后可能會更具有從事社會工作的趨向等。筆者參與過數(shù)個數(shù)據(jù)挖掘的項目，深信數(shù)據(jù)挖掘對于檔案管理具有非常大的作用，通過數(shù)據(jù)挖掘對檔案進行管理，將會是檔案管理工作的一次飛躍。

在數(shù)據(jù)挖掘這門學科中，序列分類(sequencclassification)是一個重要的分支，其中又以基于特征的分類(feature based)應用最為廣泛，經(jīng)過序列化的檔案信息可以直接被用來進行特征提取，然后使用經(jīng)典的序列分類算法進行數(shù)據(jù)挖掘，從而得到我們難以想象的，但是價值非凡的結果。

總結起來，檔案序列化存儲是一項有著重大應用前景的檔案管理技術，它可以解決目前檔案管理工作中的數(shù)據(jù)分散、結構混亂、空間開銷大等問題，而且有著極有價值的應用空間。盡管可能有諸多困難，但是筆者相信，隨著檔案研究人員的努力，檔案序列化存儲將會成為檔案信息化和檔案管理的新方向。

核心關注：拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務領域、行業(yè)應用，蘊涵了豐富的ERP管理思想，集成了ERP軟件業(yè)務管理理念，功能涉及供應鏈、成本、制造、CRM、HR等眾多業(yè)務領域的管理，全面涵蓋了企業(yè)關注ERP管理系統(tǒng)的核心領域，是眾多中小企業(yè)信息化建設首選的ERP管理軟件信賴品牌。

轉載請注明出處：拓步ERP資訊網(wǎng)http://www.ezxoed.cn/

本文標題：淺析檔案序列化存儲管理

本文網(wǎng)址：http://www.ezxoed.cn/html/support/1112187026.html

關鍵詞標簽： 淺析檔案序列化存儲管理,檔案管理工作存儲管理序列化信息化進程,ERP,ERP系統(tǒng),ERP軟件,ERP系統(tǒng)軟件,ERP管理系統(tǒng),ERP管理軟件,進銷存軟件,財務軟件,倉庫管理軟件,生產(chǎn)管理軟件,企業(yè)管理軟件,拓步,拓步ERP,拓步軟件,免費ERP,免費ERP軟件,免費ERP系統(tǒng),ERP軟件免費下載,ERP系統(tǒng)免費下載,免費ERP軟件下載,免費進銷存軟件,免費進銷存,免費財務軟件,免費倉庫管理軟件,免費下載,

本文轉自：e-works制造業(yè)信息化門戶網(wǎng)

本文來源于互聯(lián)網(wǎng)，拓步ERP資訊網(wǎng)本著傳播知識、有益學習和研究的目的進行的轉載，為網(wǎng)友免費提供，并盡力標明作者與出處，如有著作權人或出版方提出異議，本站將立即刪除。如果您對文章轉載有任何疑問請告之我們，以便我們及時糾正。聯(lián)系方式：QQ：10877846 Tel：0755-26405298。

上一篇： TDM，引領試驗數(shù)據(jù)管理變革

下一篇：分布式遠程營銷系統(tǒng)助力安鋼自動化完善銷售管理

相關文章

服務支持

拓步ERP系統(tǒng)軟件平臺11.5專業(yè)版v10.1.2...

拓步ERP系統(tǒng)軟件平臺11.5標..

金蝶KIS財務軟件標準版V8.1..

金蝶KIS財務軟件迷你版V8.1..

金蝶KIS工業(yè)貿易專業(yè)版V12...

SQL2000 4in1 ISO..

MSDE2000 SP4 簡體中..

金蝶KIS商貿高級版V4.0|破..

金蝶KIS財務軟件行政事業(yè)版V9..

金蝶KIS零售版V4.1|破解版..

熱門培訓視頻

拓步ERP系統(tǒng)平臺庫存管理系統(tǒng)培訓視頻教材

拓步ERP系統(tǒng)平臺客戶端安裝培訓..

拓步ERP財務管理系統(tǒng)培訓視頻

拓步ERP系統(tǒng)平臺數(shù)據(jù)庫安裝培訓..

拓步ERP系統(tǒng)平臺通用操作培訓視..

拓步ERP系統(tǒng)平臺采購管理系統(tǒng)培..

拓步ERP系統(tǒng)平臺考勤管理系統(tǒng)培..

拓步ERP系統(tǒng)平臺財務報表系統(tǒng)培..

拓步ERP系統(tǒng)平臺財務總帳系統(tǒng)培..

拓步ERP系統(tǒng)平臺應收帳款系統(tǒng)培..

熱門電子圖書

拓步ERP財務管理系統(tǒng)電子圖書

熱門管理軟件

拓步ERP系統(tǒng)管理軟件介紹

拓步ERP平臺系列旗艦版

拓步ERP生產(chǎn)系列標準版（進銷存..

拓步ERP業(yè)務系列倉存版（倉庫管..

拓步ERP平臺系列標準版

拓步ERP財務系列迷你版（財務管..

拓步ERP條碼系列業(yè)務標準版（條..

拓步ERP平臺系列企業(yè)版

拓步ERP平臺系列專業(yè)版

拓步ERP行業(yè)系列電子行業(yè)版


	ERP新聞動態(tài) 拓步新聞行業(yè)新聞關注產(chǎn)品觀點縱橫企業(yè)管理企業(yè)應用

	ERP解決方案按ERP應用行業(yè)分類按ERP企業(yè)規(guī)模分類按ERP管理領域分類按ERP軟件功能分類按ERP系統(tǒng)特性分類用友ERP解決方案金蝶ERP解決方案易飛ERP解決方案速達ERP解決方案其他ERP解決方案

	ERP顧問咨詢 ERP管理咨詢 ERP戰(zhàn)略診斷 ERP流程分析 ERP流程優(yōu)化 ERP風險分析 ERP可行性研究 ERP整體規(guī)劃 ERP選型招標 ERP實施監(jiān)理 ERP評審驗收 ERP績效評價 ERP基礎知識 ERP課程培訓 ERP培訓教育 ERP視頻教材

	CIO技術專欄 CIO企業(yè)應用 CIO網(wǎng)絡通信 CIO信息安全 CIO基礎設施 CIO云計算

	ERP技術支持技術支持知識庫常見問題資料庫在線學習資料庫日常辦公資料庫企業(yè)管理知識庫

	ERP系統(tǒng)價格拓步ERP系統(tǒng)價格體系拓步EIS軟件價格體系合作品牌ERP價格體系技術支持服務價格體系

	合作品牌用友UFIDA 金蝶KingDee 神州數(shù)碼Digital 速達SuperData 拓步ERP系統(tǒng)成功案例

	代理加盟合作聯(lián)盟策略代理合作指南代理聯(lián)盟前景聯(lián)盟技術支持快速搜索ERP軟件資訊

	關于拓步公司介紹公司愿景企業(yè)文化誠聘英才聯(lián)系我們在線留言在線訂購意向下載體驗登記

2021色婷婷综合久久久_国产亚洲午夜高清国产亚洲_亚洲开心婷婷中文字幕_亚洲国产中文精品字幕第一页_国产综合免费视频

ERP技術支持

技術支持知識庫

常見問題資料庫

在線學習資料庫

日常辦公資料庫

企業(yè)管理知識庫

ERP系統(tǒng)教程

ERP免費下載

ERP在線咨詢

即時聯(lián)系

服務熱線

快捷互動

猜您喜歡