元數據,英文拼寫為metadata,目前已被廣泛應用于各種信息資源的管理領域中。在檔案界,最早使用“元數據”的是美國的電子文件管理專家戴維?比爾曼,他在20世紀90年代初發表的有關電子文件管理方面的論文中首先使用了元數據這一術語。
元數據的概念目前在檔案界還沒有一個統一的定論,目前比較有代表性的描述有:
1.元數據是“關于數據的數據(Data about Data)”,其中,后一個Data是指被描述的信息資源,前一個Data則是指為理解該信息資源而存儲的有關信息,即元數據。這是元數據目前公認最為經典、通俗和簡潔的定義。
2.國際檔案理事會《電子文件管理指南》(1997)認為“元數據是關于文件的背景信息和結構的數據,是有關電子文件的技術性信息?!?/p>
3.《澳大利亞聯邦機構電子文件保管元數據標準》(1999)認為“文件保管元數據是關于電子文件背景的描述信息?!?/p>
4.英國國家檔案館《電子文件管理指南》(1999)認為“元數據是關于文件和文件集合的背景及其相互關系的結構化描述和編目數據?!?/p>
5.馮惠玲主編的《電子文件管理教程》認為元數據是“由電子文件系統自動記錄的關于文件形成時間、地點、人員、活動、文件系統、結構及內容方面的具體數據?!?/p>
6.“元數據可以理解為用來描述資源的屬性與特征的信息?!保瓌⒓艺妗峨娮游募芾砝碚撆c實踐》,科學出版社2003年版。
7.“元數據是對數據對象規范描述所形成的數據集合,通過計算機可讀的開放語言來標記元數據,就能在系統間發現、交換、轉換和理解相應的數字對象,支持系統間互操作?!保瓘垥粤帧堕_放元數據機制:理念與原則》,《中國圖書館學報》2003年3期。
以上描述雖然表述各不相同,但我們可以發現一個共同點,即元數據主要是動態地描述電子文檔各種特征的信息數據集合,并且它能為分散的、由多種數字化資源有機構成的檔案信息體系提供整合的工具與紐帶。隨著研究的深入,我們對元數據的認識在逐步深化。
檔案工作人員為便于理解,可以簡單把電子文檔的元數據視為兩方面:一是“著錄信息或著錄數據”。其中,“元數據元素就是著錄項目,元數據格式就是著錄項目之間關系的結構化表示,元數據編碼就是著錄信息的編制?!保▌⒃侥稀秾﹄娮游募芾碓獢祿脑僬J識》,《檔案學通訊》2005年2期);二是電子文檔的內容、背景和結構等方面的信息。
國外學者將元數據喻為電子文件管理系統中的“血液”,足見元數據在數字檔案館電子文件管理中發揮著舉足輕重的作用。元數據的作用主要可以概括為以下幾方面:
1.元數據能協助數字檔案館構建信息檢索機制。元數據具有動態跟蹤功能,能夠即時動態地獲取電子文件管理的各項信息。在數字檔案館的海量信息庫中,借助元數據,可以快速發現并獲取特定的信息單元。
2.元數據能維護信息的識別與讀取。電子文件所攜帶的元數據信息可以完整地記錄電子文件的原始狀態,能夠系統地映射出電子文件的信息內容、背景和結構等;還能夠映射出電子文件的生成環境和行政管理環境。只有在獲取數據對象的同時也獲取這些元數據信息,被檢索到的數據單元才是可理解的、可讀的。
3.元數據能保障電子文件的真實性與憑證性。元數據系統能夠跟蹤記錄電子文件從產生那一刻起的載體、設備及所用技術的變遷史以及使用干預該文件的整個歷史過程,即不論載體、設備、技術如何更新換代,不論使用者、使用人數的多少都全部作為歷史數據保存下來,記錄備案。這些為數字信息單元真實性和憑證性提供了重要的佐證。