电子文件、电子档......

电子文件、电子档案和数字档案概念辨析

钟万梅 张臻 任琼辉

(1.海南医学院档案馆 海口 571199;2.中国人民大学信息资源管理学院 北京 100872;3.北京电子科技学院管理系 北京 100070)

随着信息技术的广泛应用,档案记录的方式发生了变革,我国档案学界出现了电子文件、电子档案和数字档案等概念。除了人们熟知的电子文件、电子档案,近年来,“数字档案”一词也频繁出现于档案学术著作中,截至2019年7月底,中国知网期刊全文数据库(CNKI)的检索结果显示,篇名中精确包含“数字档案”(不含“馆”)的文献达933篇。为什么在已有电子文件、电子档案概念的情况下,还出现数字档案的概念?数字档案与电子文件、电子档案之间有什么联系和区别?辨明常用概念对人们开展学术研究具有积极的意义,笔者试图对这三个概念进行逐一辨析,探讨其中的联系与区别。

本文将按照这三个概念出现的先后顺序,依次分析其内涵和外延,并将三者的内涵和外延进行比较,明确它们之间的联系与区别,最后从人们对它们的研究内容入手,分析这三个概念各自侧重的含义。

一、电子文件

(一)电子文件的内涵

“电子文件”是20世纪中期以后出现的新名词,是计算机技术的伴生物,早期人们称之为“数字式文件”或“机读文件”,20世纪90年代后期人们才统一用“电子文件”的称呼。[1]截止目前,国内外有关电子文件的定义有很多,我国学者较多采用的是《档案工作基本术语(DA/ T 1-2000)》(以下简称《术语1》)和《电子文件归档与管理规范(GB/T 18894-2002 )》(以下简称《规范1》)对电子文件的定义。《术语1》对电子文件的定义是“以数码形式记录于磁带、磁盘、光盘等载体,依赖计算机系统阅读、处理并可在通信网络传输的文件”,《规范1》对电子文件的定义是“指在数字设备及环境中生成,以数码形式存储于磁带、磁盘、光盘等载体,依赖计算机等数字设备阅读、处理,并可在通信网络上传送的文件。”2014年《电子档案管理基本术语(DA/T 58—2014)》(以下简称《术语2》)对电子文件的定义是“国家机构、社会组织或个人在履行其法定职责或处理事务过程中,通过计算机等电子设备形成、办理、传输和存储的数字格式的各种信息记录。电子文件由内容、结构和背景组成。”根据《术语1》对“文件”的定义:“国家机构、社会组织或个人在履行其法定职责或处理事务中形成的各种形式的信息记录”,《术语2》的定义等同于“通过计算机等电子设备形成、办理、传输和存储的数字格式的文件。电子文件由内容、结构和背景组成。”

由以上定义可知电子文件的内涵:

(1)电子文件的本质是文件,是“国家机构、社会组织或个人在履行其法定职责或处理事务中形成的各种形式的信息记录”。文件具有“特定的要素、作用和效力”,在要素上,文件由内容、结构和背景组成;在作用和效力上,能成为机构、个人活动的证据。[2]

(2)与其他形式的文件相比,电子文件的特殊性表现在,它是以数字形式存在的,其形成、办理、传输、存储和阅读等操作都需要依赖计算机等电子(数字)设备。

(二)电子文件的外延

对事物的种类进行划分是认识事物外延的一种方法,仅从电子文件的定义中我们无法更深入地认识其外延,因此可从电子文件的分类入手。分类可以从多种角度进行,但任何一个角度的分类结果,其子类的外延之和应同母类的外延相等。[3]

由冯惠玲教授主编的《电子文件管理教程》[4]、金波、丁华东教授主编的《电子文件管理学》[5]等教材,按电子文件信息的存在形式,把电子文件分为文本文件、数据文件、图形文件、图像文件、影像文件、声音文件、命令文件,其中图像文件主要是指由扫描仪扫描的各种原件画面,用数码相机拍摄的照片等。影像文件、声音文件包括由视频、音频设备捕获的模拟影像、声音转换成的数字形式的文件。[6]肖秋会在《电子文件长期保存:理论与实践》中指出,“电子文件的产生有两种方式,一种是原生性的,……另一种则是对传统介质档案做数字化处理以后形成的数字化副本。”[7]从以上分类结果看,电子文件包括直接在计算机系统形成的原生性电子文件,也包括传统载体文件、档案经数字化形成的数字化副本。

与此同时也有同志持另一种观点,即认为电子文件仅指原生性的电子文件,不包括传统载体文件、档案的数字化形式。如国家档案局《全国档案信息化建设实施纲要》所列的5个示范性数字档案馆中,深圳市数字档案馆、天津开发区数字档案馆、青岛市数字档案馆和江苏省电力公司数字档案馆对建设的数字信息资源分类如下:传统档案馆馆藏档案的数字化信息、电子政务系统或办公自动化系统形成的应归档的电子文件(电子档案)、政府综合信息,[8][9][10][11]这表明有些同志认为电子文件仅指原生性电子文件,而不包括传统载体档案的数字化副本。

这说明人们在对电子文件外延的认识上存在分歧,分歧集中在传统载体文件、档案的数字化副本能否称为电子文件,这包含两个问题:一是传统载体文件的数字化副本能否称为电子文件,二是传统载体档案的数字化副本能否称为电子文件。从电子文件的定义来看,本文列举的三个定义只界定为“以数码形式记录”“在数字设备及环境中生成”,都没有明确限定电子文件须在计算机等电子设备中“直接形成”,因此传统载体文件的数字化副本符合定义的要求,可以称为电子文件。传统载体档案的数字化副本能否称为电子文件?笔者认为不能。主要理由如下:首先,从文件与档案的关系来看,不是所有的档案都能称为文件,因此传统载体档案的数字化副本不能称为电子文件。电子文件的属概念是《术语1》中定义的文件,是“国家机构、社会组织或个人在履行其法定职责或处理事务中形成的各种形式的信息记录”。同样根据《术语1》,档案的定义是“国家机构、社会组织或个人在社会活动中直接形成的有价值的各种形式的历史记录”,比较文件和档案的定义可以发现,两者的形成主体一致,但是形成领域不一致,文件是在“履行其法定职责或处理事务”中形成的,具有明显的“公务性”;档案是在“社会活动”中直接形成的,“社会活动”的范围显然比公务活动要广,这就说明文件是档案的一个重要来源,但不是全部来源。其次,从管理过程来看,电子文件可以“转化”为档案,但传统载体档案数字化副本已经是档案,不存在“转化”问题,两者应区别。电子文件主要在业务部门产生,其中有价值的部分要经归档环节纳入档案部门保存。传统载体档案的数字化副本是为提供档案信息资源的共享利用需要,而对馆(库)藏中社会利用价值高的档案进行数字化处理的产物,是在档案部门产生的,不需再经历归档环节。如果传统载体档案的数字化副本是电子文件,那么它需要再经历归档环节,显然是不恰当的。

综上所述,电子文件的外延应是原生性电子文件和传统载体文件的数字化副本,不包括传统载体档案的数字化副本。

二、电子档案

(一)电子档案的内涵

我国最早明确电子档案定义的是国家标准《CAD电子文件光盘存储、归档与档案管理要求 第一部分:电子文件归档与档案管理(GB/T 17678.1—1999)》(以下简称GB/T 17678)[12],该标准对电子档案的定义是“具有保存价值的已归档的电子文件及相应的支持软件产品和软、硬件说明。”2012年,国家档案局发布了《电子档案移交与接收办法》(档发[2012]7号),该办法对电子档案的定义是“指机关、团体、企事业单位和其他组织在处理公务过程中形成的对国家和社会具有保存价值并归档保存的电子文件。”《术语2》对电子档案的定义是“具有凭证、查考和保存价值并归档保存的电子文件”。

以上定义虽然有些许差异,但无实质区别,都认为电子档案是“具有保存价值并归档保存的电子文件”,可见,电子档案由电子文件“转化”而来,是电子文件运动到档案部门的称谓,也有很多学者不使用电子档案的概念,全生命周期都使用电子文件的概念[13]。其次,电子档案与电子文件也是有区别的,由电子文件到电子档案,需要经过价值鉴定,不是所有的电子文件都能成为电子档案,只有那些具有保存价值而被档案部门保存起来的电子文件才能成为电子档案。

(二)电子档案的外延

由于电子档案是归档保存起来的电子文件,电子档案应“沿袭”电子文件的外延,但范围更狭窄,应舍弃那些没有保存价值的、没有归档保存的部分,即电子档案的外延是具有保存价值并归档保存起来的原生性电子文件和传统载体文件的数字化副本。

三、数字档案

国内最早对数字档案下定义的是宋岩[14]。2005年,他首次将数字档案定义为:“是指用计算机等工具对历史记录进行数字编码,并将所得数据记录保留在盘、片等载体上的一种档案。从记录方式来说,数字档案是用计算机语言,将历史记录数据化的形式来记录的……从载体来说,它摒弃了人们常用的纸张等常用的载体,而用磁盘、光盘等载体。”[15]此定义的实质是认为数字档案是传统载体档案的数字化副本。

2010年,前国家档案局局长杨冬权认为,“数字档案就是以数字信号记录的文件或档案,它是在数字环境中生成与传输,以数码形式存储于特定载体之上,必须依赖于专用设备和软件才能读取的一种记录。”[16]根据此定义,数字档案包含了电子文件、电子档案和传统载体档案的数字化副本。

2011年,蔡学美认为“数字档案是数字档案馆概念的产物,是数字档案馆馆藏数字资源的总称,包括电子档案、传统载体转换生成的数字化档案和有价值的数字信息资料,数字档案强调其数字特征,其中的数字化档案、数字信息资料并不具备原生的档案特性。”[17]此定义认为数字档案馆馆藏的数字资源都是数字档案,也包括那些非档案但有价值的数字信息。

2013年,梁惠卿认为,“所谓数字档案,是指机关、团体、企事业单位和其他组织以及个人在社会活动中,通过计算机等电子设备直接形成以数字代码记录的文字、图表、图像、音频、视频等不同形式的历史记录。”[18]根据前述《术语1》对档案的定义,此定义可以理解为数字档案是原生性数字形式的档案,在内涵与外延上都与电子档案相近,但不包括传统载体文件的数字化副本,即认为数字档案是原生性的电子档案。

2014年,国家档案局发布的《数字档案COM和COLD技术规范(DA/T 53-2014)》(以下简称《规范2》)对数字档案的定义是“以数字形式存在的档案信息资源,包括传统载体档案数字化产生的相关信息、电子档案等。”

2015年,赵豪迈认为“数字档案是存储于电磁介质上的,以0、1二进制编码形式存在的,可以通过计算机网络传输的档案,包括利用计算机直接形成的档案和经由数字化之后转变为计算机和多媒体技术支持的纸质档案信息。”[19]根据此定义,数字档案是指原生性的电子档案和传统载体档案的数字化副本。

比较以上六条定义,人们对数字档案的认识有共同之处,都认为数字档案是以数字形式存在的,需要依赖计算机等电子设备。但在对属概念和外延的理解上,存在较大差异,具体见下表1.

表1 数字档案相关定义观点分析

在属概念的认识上,有以下几种观点:

(1)认为数字档案是档案。宋岩、杨冬权、赵豪迈都在定义中直接用了“档案”作为数字档案的属概念,梁惠卿间接用“档案”作为数字档案的属概念。

(2)认为数字档案是文件。杨冬权在定义中,同时使用了“文件”和“档案”作为数字档案的属概念。

(3)认为数字档案是资源。蔡学美、《规范2》分别使用了“数字资源”“档案信息资源”作为数字档案的属概念。

在数字档案外延的认识上,有以下几种观点:

(1)认为数字档案是指传统载体档案的数字化副本,如宋岩的观点。

(2)认为数字档案是指原生性的电子档案,如梁惠卿的观点。原生性电子档案即归档保存的原生性电子文件,不包括传统载体文件的数字化副本。

(3)认为数字档案包括原生性的电子档案和传统载体档案的数字化副本,如赵豪迈的观点。

(4)认为数字档案包括电子档案、传统载体档案的数字化副本,如《规范2》的观点。电子档案包括归档保存起来的原生性电子文件和传统载体文件的数字化副本,比原生性电子档案外延要宽。

(5)认为数字档案包括电子文件、电子档案、传统载体档案的数字化副本,如杨冬权的观点,其中电子文件包括未被归档、被电子档案排除在外的部分。

(6)认为数字档案包括电子档案、传统载体档案的数字化副本和有价值的数字信息资料,如蔡学美的观点。

可见,目前人们对数字档案的认识,无论是从内涵还是外延上都存在分歧。那么,数字档案应该是什么?应该包含什么?笔者认为,确定数字档案的内涵和外延要从语义上与其他相关概念的比较中来确立。

从语义上来说,概念由名词组成,所选的名词应贴切表达概念的含义。[20]数字档案概念由“数字”和“档案”组成,因此,“数字”和“档案”应能贴切表达数字档案的概念。

首先来看“数字”。“数字”是指信息的记录方式,是以0、1二进制编码形式存在的。“数字”的产生有两种方式:一是直接于计算机等电子设备中产生的原生性数字形式,二是由模拟记录转化成的数字形式,因此,数字档案应该包含这两种方式产生的数字形式,只限于其中的一种都不符合词义,因此认为数字档案仅限于传统载体档案的数字化副本或原生性的电子档案都是不合理的。

其次来看“档案”。档案应区别于文件、资源、档案信息资源等概念。虽然人们对档案有很多不同的定义,但对档案的基本认识却是一致的:档案应是归档保存起来的历史记录。文件包含了没有保存价值、不能成为档案的部分;资源的范围太广,档案只是其中的一部分;档案信息资源与档案也有区别,根据潘连根[21]、于晓庆[22]等人对档案信息资源的理解,档案信息资源归根结底是一种有用的或可供利用的档案信息。档案信息不能等同于档案:(1)档案是档案信息及其载体的统一体,而档案信息可以脱离其固定的载体进行传播、利用;(2)档案具有原始记录性,而档案信息则不要求原始性;(3)档案具有完整性,而档案信息可以是被节取的片段。(4)档案具有凭证价值,可以作为法庭上的呈堂证供。档案信息则不能作为凭证,发挥的主要是参考作用。因此,数字档案以“档案”作为属概念更符合词义。

因此,数字档案定义为“以数字信号记录的档案”或者是“存储于电磁介质上的,以0、1二进制编码形式存在的,可以通过计算机网络传输的档案”比较合理。在外延上,应该包括电子档案和传统载体档案的数字化副本,《规范2》的外延比较合理。

人们创造并使用一个新概念的前提应该是已有的概念不能满足表达和交流的需要。从词义上看,“电子文件”“电子档案”中的“电子”实质是数字的含义,那为什么在已有电子档案概念的情况下,还使用数字档案的概念呢?数字档案能与相近的概念电子档案相区别吗?如前所述,电子文件是以数字形式存在的文件,外延上包括原生性电子文件和传统载体文件的数字化副本;而电子档案是具有保存价值而归档保存起来的电子文件,也就是具有保存价值并归档保存起来的原生性电子文件和传统载体文件的数字化副本。电子文件和电子档案概念都无法周延传统载体档案的数字化副本,因此,数字档案概念在内涵和外延上都能与电子文件和电子档案相区别,有存在的独立价值。

四、电子文件、电子档案和数字档案比较

通过前文的分析,电子文件、电子档案和数字档案概念有联系也有区别,下面将从内涵、外延和研究内容方面来比较。

(一)内涵比较

根据电子文件、电子档案和数字档案的定义对比相关属性,如下表2,我们可以发现(1)电子文件、电子档案和数字档案在形成主体、存在形式、存储载体、依赖环境等方面是一致的。在形成领域方面,数字档案比电子文件和电子档案要广。(2)属概念上有区别。电子文件的属概念是文件,其中包括无保存价值、不能纳入档案范围的部分。电子档案的属概念是电子文件,是由电子文件直接“转化”而来的,是归档保存的电子文件。数字档案的属概念是档案,是归档保存起来的历史记录,包括电子档案和馆(库)藏中的传统载体档案。(3)保管场所有区别。电子文件的保管场所包括业务部门、档案部门(全生命周期使用电子文件概念),电子档案、数字档案的保管场所都在档案部门。

表2 电子文件、电子档案和数字档案定义对比表

(二)外延对比

根据前文所述,电子文件的外延包括原生性的电子文件和传统载体文件的数字化副本,电子档案的外延是因具有保存价值而归档保存起来的原生性电子文件和传统载体文件的数字化副本。数字档案的外延包括电子档案与传统载体档案的数字化副本。可见,电子文件、电子档案和数字档案的外延有很大一部分重合,但是并不完全一致,它们的关系如图1所示,归档保存起来的电子文件是电子档案,电子档案和档案部门收藏的传统载体档案的数字化副本是数字档案,数字档案与传统载体档案共同构成了档案总体。

(三)研究内容对比

在研究实践中,人们关注电子文件、电子档案和数字档案的哪些方面?分析这个问题有助于我们进一步理解和把握电子文件、电子档案和数字档案的不同。

1.电子文件的研究内容

有关电子文件的研究内容有很多,可见于各类著作、论文。张宁博士在论文《2000-2014年我国电子文件研究发展分析》中,依据中国期刊全文数据库、中国优秀硕士学位论文数据库、中国博士学位论文全文数据库、中国重要会议论文全文数据库、中国重要报纸全文数据库、中国人民大学图书馆馆藏中的相关论文、书籍和文献,采用Citespace文献可视化分析工具对2000-2014年我国电子文件研究的发展状况进行了统计和分析,她在文中以五年为一阶段梳理了2000-2014年间我国电子文件的研究主题分布情况。归纳起来,这期间人们对电子文件的研究主要集中在“电子文件的基本含义”“管理原则”“电子文件的原始性、真实性”“电子文件与纸质材料的对比”“电子文件凭证作用”“电子文件归档管理”“电子文件保存”“风险管理”“安全管理”“电子文件迁移和移交”“电子文件前端控制”“电子文件信息管理”“电子文件管理机构”“电子文件宏观管理”等主题上。[23]根据同样的数据来源和分析工具,笔者补充了2015-2018年的数据,得出电子文件的研究主题主要聚焦在“电子文件管理”“档案管理”“电子文件归档”“前端控制”“信息安全”“电子文档”“电子文件管理系统”“办公自动化”等方面,不超出2000-2014年的范围。

从中可以看出,人们对电子文件的关注点在:(1)对电子文件的基本认识,包括电子文件的含义、管理原则、特点(与纸质材料的区别)、电子文件的原始性、真实性等方面;(2)电子文件的管理。内容包括电子文件前端控制、归档、保存、风险管理、安全管理、保护、管理流程、宏观管理以及管理机构等方面,电子文件的管理目标是通过有效的管理手段,确保电子文件的真实性、完整性、可靠性和长期可读性。

2.电子档案的研究内容

为了便于比较,对电子档案和数字档案的研究内容进行分析的数据来源与电子文件一致。笔者基于上述数据来源,以“电子档案”为标题,查阅了2000-2018年的文献,用Citespace工具进行聚类分析,得到电子档案的研究主题分布图,见图2。

从分布图可以看出,2000-2018年间,人们对电子档案的研究主要集中在“电子档案管理”“档案管理”“电子文件归档”“电子档案信息”“存储载体”“电子文件”“纸质档案”“办公自动化”“信息技术”“档案信息”“对策”“问题”“信息安全”“保管条件”“凭证作用”“档案利用”等方面。从中可以看出:(1)对电子文件的研究依然比较受关注,这是因为电子文件是电子档案的“前端”;(2)关注电子档案的管理,包括电子文件的归档管理,电子档案的存储、保管、信息安全和档案利用等方面;(3)注重对办公自动化、信息技术等电子环境的研究。

从分布图可以看出,2000-2018年间,人们对电子档案的研究主要集中在“电子档案管理”“档案管理”“电子文件归档”“电子档案信息”“存储载体”“电子文件”“纸质档案”“办公自动化”“信息技术”“档案信息”“对策”“问题”“信息安全”“保管条件”“凭证作用”“档案利用”等方面。从中可以看出:(1)对电子文件的研究依然比较受关注,这是因为电子文件是电子档案的“前端”;(2)关注电子档案的管理,包括电子文件的归档管理,电子档案的存储、保管、信息安全和档案利用等方面;(3)注重对办公自动化、信息技术等电子环境的研究。

3.数字档案的研究内容

用同样的方式,得到了数字档案的研究主题分布图,见图3。从分布图可以看出,2000-2018年间,人们对数字档案的研究主要集中在“档案数字化”“数字档案信息”“档案干部队伍”“档案管理”“温湿度控制”“档案规范化”“软件研发”“档案库房”“档案信息安全”“档案修复”等方面。从中可以看出人们对数字档案研究的关注点:(1)传统载体档案的数字化工作。在分布图中,含“数字化”的关键词出现四处,这说明传统载体档案的数字化是数字档案研究的重要内容;(2)数字档案的保护。对“温湿度控制”“档案库房”“档案修复”“档案信息安全”等与档案保护相关的主题的关注,说明档案保护是数字档案的研究重点。

对比电子文件、电子档案和数字档案的研究内容我们可以发现,电子文件、电子档案的联系紧密,它们的研究内容存在大面积的重合。突出与纸质档案对比的“数字”特征,如电子文件的原始性、真实性和凭证价值等,注重对归档、存储、保管、信息安全和档案利用等管理问题的研究,目的在于维护电子文件、电子档案的真实性、完整性、可靠性和长期可读性。而数字档案的研究内容则鲜少关注电子文件、电子档案的“数字”特征,也较少关注“收、管、存、用”等管理流程问题,研究重点在传统载体档案的数字化和数字档案的保护方面。

五、结语

虽然电子文件、电子档案和数字档案都可以用来表示数字形式的档案,在形成主体、存在形式、存储载体和依赖环境上是一致的,如都由国家机构、社会组织或个人形成的,以数字形式存储于磁带、磁盘、光盘等载体,依赖计算机等电子设备进行操作处理,但三个概念之间具有明显的区别:(1)电子文件与数字档案。电子文件按有无保存价值可以分为两类,一类是具有保存价值而归档保存起来的电子文件,经归档保存后可以成为数字档案;一类是没有保存价值,不能归档保存的电子文件,这类电子文件不能成为档案。文件可以成为档案,但不是所有的档案都来源于文件,数字档案中的很多历史记录的数字化形式就不能称为电子文件。(2)电子文件与电子档案。电子档案是归档保存起来的电子文件,电子文件与电子档案存在直接的“转化”关系,所有的电子档案都来源于电子文件,但不是所有的电子文件都能成为电子档案。(3)电子档案与数字档案。所有的电子档案都是数字档案,但传统载体档案的数字化副本不是电子档案,电子档案和传统载体档案的数字化副本共同构成数字档案。(4)在研究内容方面,人们注重对电子文件、电子档案基本特性、管理方法的研究,这是对传统档案及其管理方式在数字时代的革新。在数字档案的研究方面,人们主要关注传统载体档案的数字化及数字档案载体、信息的保护研究。