“机读文件”名词演变研究
[摘 要]信息时代,计算机已经和网络的飞速发展,从最初的主机式计算机到当代的PC机;从密集的处理大量复杂数据到个人可以形成简单的文字、图形等数据文件;从人类认识的角度来说,人类对于信息的传播方式从面对面的口口相传发展到当今世界的网络高速传递。本文重点针对将“机读文件”这一名词从人类认识发展变化的角度,来分析从“机读文件”名词应用与改变的过程,从中寻找规律性的东西,对“机读文件”名词演变与发展的脉络进行一个清晰的勾画和展望。
[关键词]机读文件;名词;演变
前言
本文所研究的“机读文件”这一广泛定义的名词的范畴中包括穿孔卡带、穿孔卡片、机读档案等事物。
国际档案理事会制定的档案术语中,把“机读文件”定义为:“通常以代码形式记录于载体,如磁盘、磁带或穿孔卡带上的文件,它的内容只有用机器才能存取。与数据档案不同之处是,它按来源原则进行整理,这就是机读文件。”
(1)
一、国外对于“机读文件”名词演变的认识
“机读文件”最早产生于1890年,当时联邦政府统计局使用穿孔卡片和一个制表设备来处理当年的某些数据。“直到1930年不断有联邦政府机构使用办公机械并产生机读文件。在二十世纪40年代末50年代初,电子计算机的产生和它在联邦机构中的应用才使得机读信息的数量稳步增加。”
(3)这是查尔斯M・多勒在《联邦政府和国家档案馆的机读文件》一文中,详悉了机读文件产生的时代。澳大利亚国家档案馆的Greg O’shea先生解读道:“‘机读文件’这一概念一直用到80年代末,大约90年代初,‘电子文件’才开始使用。这一明确的回答让我们了解到人类对于‘机读文件’这个概念从开始接触研究到进行转化经历了近100年的时间。”
(4)
长期以来,机读文件已被人们普遍公认为是专指由计算机处理的文件。国际档案理事会自动化委员会给“机读文件”下了这样一个定义:“录制在这样一种载体上的文件:它只借助于计算机或它的软件才能供研究用。”
(5)
说到“机读文件”最初的实体形式,不能不提到穿孔卡片。穿孔卡片是一种由薄纸板制成,用孔洞位置或其组合表示信息,通过穿孔或轧口方式记录和存储信息的方形卡片。是手工检索和机械化情报检索系统的重要工具。穿孔卡片可应用于产品、材料、情报资料的管理和索引编排等方面,但亦有较大局限性,如信息存贮量小,代码容量有限,检索操作速度较慢,卡片易损坏等等。随着计算机在数据处理和情报检索中的€成功应用,穿孔卡片已被磁性信息载体所取代,只有机器穿孔卡片仍作为计算机输入数据的一种手段继续使用着。
公元1880年,美利坚合众国举行了一次全国性人口普查,为当时5000余万的美国人口登记造册。当时美国经济正处于迅速发展的阶段,人口流动十分频繁,再加上普查的项目繁多,统计手段落后,从当年元月开始的这次普查,花了7年半的时间才把数据处理完毕。也就是说,直到快进行第二次人口普查时,美国政府才能得知第一次人口普查期间全国人口的状况。
人口普查需要大量处理的是数据,如年龄、性别等用调查表采集的项目,并且还要统计出每个社区有多少儿童和老人,有多少男性公民和女性公民等等。这些数据是否也可由机器自动进行统计?采矿工程师霍列瑞斯想到了纺织工程师杰卡德80年前发明的穿孔纸带。杰卡德提花机用穿孔纸带上的小孔,主要用来控制提花操作的步骤,即编写程序,霍列瑞斯则进一步设想要用它来储存和统计数据,发明一种自动制表的机器。
霍列瑞斯首先把穿孔纸带改造成穿孔卡片,以适应人口数据采集的需要。由于每个人的调查数据有若干不同的项目,如性别、籍贯、年龄等等。霍列瑞斯把每个人所有的调查项目依次排列于一张卡片,然后根据调查结果在相应项目的位置上打孔。例如,穿孔卡片“性别”栏目下,有“男”和“女”两个选项;“年龄”栏目下有从“0岁”到“70岁以上”等系列选项,如此等等。统计员可以根据每个调查对象的具体情况,分别在穿孔卡片各栏目相应位置打出小孔。每张卡片都代表着一位公民的个人档案。
直到1888年,霍列瑞斯博士才实际完成自动制表机设计并申报了专利。他发明的这种机电式计数装置,比传统纯机械装置更加灵敏,因而被1890年后历次美国人口普查选用,获得了巨大的成功。杰卡德和霍列瑞斯分别用开创了程序设计和数据处理之先河。以历史的目光审视他们的发明,正是这种程序设计和数据处理,构成了电脑“软件”的雏形。
穿孔卡片有许多种类。按处理手段可分为手工穿孔卡片和机器穿孔卡片。还可以按穿孔部位、孔洞形状、编码方法等特征来分类。其中,较常见的类型有:边缘穿孔卡片、中心穿孔卡片、槽式穿孔卡片、窗式穿孔卡片、组合穿孔卡片和透光穿孔卡片。机器穿孔卡片又有45列孔、80列孔和90列孔之分。
由此可见,“穿孔卡片”的名词由来是一种形象命名法,与穿孔卡片本身的载体形式有关,此时的“穿孔卡片”无论是名词还是使用方法,都是逻辑使用与物理使用相结合的方式,通过逻辑方式来进行程序和内容的编写,和读取;通过物理方式对数据进行保存和移动。
二、我国对于“机读文件”名词演变的认识
国际档案理事会制定的档案术语中,把“机读文件”定义为:“通常以代码形式记录于载体,如磁盘、磁带或穿孔卡带上的文件,它的内容只有用机器才能存取。与数据档案不同之处是,它按来源原则进行整理,这就是机读文件。”
(6)
威廉姆L・罗佛斯在《档案陷阱:数量和操作》一书中指出了一个重要的线索,他强调“机读”的意思是指离开机器就不能阅读,而不是指可以借助机器来帮助阅读。这一线索点明了缩微胶片和机读文件的本质区别:“缩微胶片需要借助机器,但从本质上讲它是人工可识读的”。
(7)也就是说“缩微胶片”如果不利用特殊的专用机器,其内容仍然是可以被人类直接识读的。 这些研究成果为我国对于机读文件的研究提供了方向,我国对于“机读文件”、“机读档案”的研究要晚于国外。
90年代中期以前,我国对于“机读文件”的研究和定义并没有明确的针对性,与国外的理论研究相比,我国开始的时间比较晚。在1994年出版的《档案学词典》中对于“机读文件”作如此解释:“机读文件是由应用软件控制处理,进行编辑或输,出信息的计算机文件ร。”
(8)
陈作明教授在《机读文件及其整理归档》一文中详细介绍了“机读文件”的概念,种类及其归档方法等问题,使我国档案学界对“机读文件”有了较为系统的理解。首先,陈教授对于“机读文件”的解释为:“机读文件是通过计算机‘写入’并且只有通过计算机才能阅读的文件,机读文件的载体,在现阶段主要是磁带、磁盘并开始使用光盘。”对此,陈教授有一个重要的观点,由于文秘工作现代化以计算机为主要工具,会产生大量的机读♡文件,这些“机读文件”处理完毕后,其中有保存价值的유要归档,转化为“机读档案”。
(9)也就是说,“机读文件”其实是现行文件的一种,现行文件包括纸质文件和“机读档案”,和纸质现行文件归档保存后形成纸质档案一样,“机读文件”经过归档保存后便会形成“机读档案”。
三、实践范畴中“机读文件”名词的特殊性分类
人类对于“机读文件”这一名词的及其演变的认识发展,依赖于“机读文件”自身的发展演变,随着科技的不断变化发展,“机读文件”的形态,功能种种方面都在不断变化之中,因此,人类的认识也在随着这种物质的变化而变化。
十九世纪80年代,从美国第一次使用穿孔卡片开始,“机读文件”的产生和使用便出现在人类的认识当中,证明“机读文件”已经成为一种成熟的,可重用的文件形式被应用到实际工作中来。此后100年来的发展,“机读文件”的类型也在不断的变化之中。
陈作明教授在《机读文件及其整理归档》中将“机读文件”按其载体分为磁带、磁盘和光盘三类;按其内容则分为程序类和数据类二部分。
(一)程序类
(10)
包括计算机操作系统程序(对计算机进行全面控制的程序)、语言处理程序、数据库管理程序、数据通讯程序和实用程序等。如档案部门研制的《文件、档案、资料一体化管理程序》、《档案主题词自动标引程序》等。这些都可以概括为“系统程序”或“系统软件”,这类程序是最接近硬件(机器)的软件,大部分是由计算机设计者提供的,个别已经固化在机器里面。此外,有一种计算机用户为解决实际的问题而编制的程序,一般可以称为应用程序。程序类文件是使用计算机的工具,对于使用单位来说,归档之后是一种能够扩展计算机功能的特殊的设备档案,对于程序开发单位来说,它还反映本单位研究开发计算机技术的历史,是本单位的一种科研发展史料,而且,其中的应用程序往往与相应的数据类文件有密不可分的联系,也是说,数据类文件必须与相应的应用程序文件结合,才能被读取。因此,它们甚至应当同“数据类机读文件”一起保存。也就是说,诸如此类的“机读文件”社会称之为“计算机程序”,其本质属性与“机读文件”相通。
(二)数据类
数据,是数字、字母、图形的集合,也有人把它定义为“记载下来的事实”,数据类文件形成的前提是有一定的程序类文件,然后是用计算机录入数据而形成的。其形成过程是计算机用户使用相应的程序类机读文件进行信息(或数据)处理的过程。按其与纸质文件的关系来分析,数据类机读文件有两种:一种是纸质文件的补充,它的内容与纸质文件是不同的。这就是通过计算机撰写并传递的文件,它从制成到传递处理都是由计算机完成的,没有产生过纸质文件。另一种是与相应的纸质文件内容相同的文件,大多数是将纸质文件的内容输入到计算机里去而后形成的。其形成的直接目的是为了方便检索,客观上起了多套保存的作用,比如人口普查统计数据的机读文件就是如此,此类“机读文件”亦可称为“机读数据”。