基于数据挖掘网络诊断法的网络图书馆建设
[摘 要]随着网络技术与应用的不断发展,计算机网络在图书馆建设中已经变得越来越普遍。网络图书馆建设严重依赖于计算机网络,因此网络运行的稳定性、可靠性就显得至关重要,于是网络管理就应运而生。本文是通过数据挖掘网络诊断法应用在高校网络图书馆建设中。它对大规模网络图书馆的故障诊断具有理论指导意义和实际应用价值。
[关键词]网络图书馆;数据挖掘;故障诊断
一、引言
在信息社会里,网络图书馆具有巨大的发展潜力和优势。但在我国高校目前的客观条件中,建设网络图书馆还存在诸多问题,网络的可靠性是推行网络图书馆的发展与建设过程中的一个难点。图书馆网络的通讯线路和站点都会由于某种原因出现故障,甚至有可能造成整个图书馆网络不能正常工作。因此对网络图书馆的可靠性研究已成为当今急需解决的课题之一。近几年来,网络的可靠性研究已经有很多成果。本文是通过数据挖掘网络诊断法应用在高校网络图书馆建设中。它对大规模网络图书馆的故障诊断具有理论指导意义和实际应用价值。
二、数据挖掘网络诊断法
应用数据挖掘方法,网络故障诊断系统可以通过分析已有的异常信息的正确处理方法以及各种异常之间的前后关系的记录,得到其间的关联规则,这些有价值的信息可用于网络故障的定位检测和严重故障的预测等任务。并能根据当前的诊断信息,就可以得到其后续发生各种情况的可能性,对危险事件可以起到预防的作用,从而使通信网络得以安全运转。
数据挖掘的任务是从大量的数据中的找到模式或知识。根据它们的作用方式可分为两类:一类称为描述性模式,它是使存在于数据描述的规律。如泛化模式,聚类分析模型,及时问的关联模式序列模式。另一种是预测模型,它是基于知识从现有的数据挖掘某些数据得到预测未知的性质。包括分类模型和回归模型。其中,分类模型是一个重要的预测模型。
抽象分析,挖掘分类模型步骤如下:首先,我们必须把挖掘数据库进行预处理:把数据库中的记录进行排序ฎ,包括取消一些不完整的记录和独立的性质,主要是为了确定一个类别的属性,并确保每一个记录类别属性已经给出。然后,从待挖数据中提取形成训练样本集。把训练样本集运用一种或多种分类挖掘方式进行挖掘,最后输出某种方式的分类模式。分类模式的方式有决策树,数学公式,分类规则等。
所谓数据挖掘是从大量的不完整的,嘈杂的,模糊的和随机提取隐含在其中的实际应用数据,人们先前不知道,但又是潜在的有用的信息和知识。这个定义包括几层意思:数据源必须是真实的,有很多嘈杂的,发现是用户感兴趣的知识,知识发现是可以接受的,可以理解,可以应用,不要求发现放之四海皆准的知识,仅支持特定的发现问题。数据挖掘可以看作是KDD的一个小步骤,如图所示ღ。
三、数据挖掘网络诊断法在高校网络图书馆智能服务中的应用
目前,在网络中的高校图书馆智能服务网络诊断数据挖掘应用还比较少,和智能网络服务的许多方面,该库已经应用:如分类,编目,索引,流通管理,信息检索等。在建设一个图书馆以及图书馆和信息管理过程的可靠性分析,智能书籍改进信息技术,从而完成传统图书馆向数字图书馆发展的数据挖掘过程中使用的网络诊断方法是智能图书馆的飞跃,是一个重要的研究图书馆的发展和建设。
1、数据挖掘网络诊断法在网络图书馆文献分类中的应用
文档分类是根据相似性和文学之间的差异的内容和形式定义的,按照一定的体系,有系统地组织和分化的文献。工作人员在图书馆分类是基于文献揭示和整理文件,所反映的主题内容和功能的外在形式。文学的主要目的是基于对组织文化的不同类别的学科知识的系统分类,使文学的同一学科性质在一起,形成学科体系,使用文献检索,以满足读者的需求。
网络图书馆收集了大量的书籍和文件,也有几十万,上百万,甚至千万。每个在这些文献中引用的文件分类给予DOI。每个CLC对准对应于一个固定的位置。如此大量的文档可以按照分类系统排列有序。然而,这样一个庞大的网络图书馆系统,有效和快速的分类管理,极大地测试计算机系统网络的可靠性。当严重的网络故障发生在网络图书馆系统,以及它如何能够有效排除故障?当在网络图书馆文献分类数据挖掘的网络故障诊断,可以发挥自己的优势,迅速而准确地排除网络故障,网络图书馆文献分类数据挖掘的网络诊断具有非常广阔的应用前景。
2、数据挖掘网络诊断法在网络图书馆的检索工作环节的应用
现有的网络库的检索方面是利用人工智能技术来模拟人脑的收集,存储,检索和匹配,推理(感性)和管理。和信息的收集,存储,检索和匹配,推理(感性)和管理的检索过程中其他方面的工作,难免会遇到诸如故障情况。数据挖掘的网络诊断,以排除网络库中检索故障的各个方面都有非常快速和准确的优点,将解决这个问题不能得到解决在图书馆遇到的检索网络链路上,导致网络库检索革命。“
检索网络图书馆是一个综合的人机系统由一个由几个子网络,由全球性组织实现图书数据检索和共享,提供分析,规划,预测和信息综合控制系统的一部分。经常会发生在这样一个大的检索系统的故障的问题,因此操作系统到网络所需的系统维护在固定的时间间隔,例如没有解决的问题。并解决了数据挖掘的核心是研究网络诊断方法的一个网络问题。如果在先进的数据挖掘库网络诊断网络可靠性分析技术使用时,将被绑定到一个网络库的变化。
3、数据挖掘网络诊断法在图书馆自动化网络中的应用
计算机网络连接,并控制了大量的库现代化图书馆的网络,也称为库计算机网络的形成。由于书目数据库的出发点和它的北美建筑的基础上,也被称为书目ษ机构。
图书馆自动化网络具有多种功能:
①连续出版物管理,建立连续剧会员库,开展自动化业务的联合目录。
②权限控制,通过网络集线器规范文档书目数据库,编目成员馆,以控制名称规格(人名,地名,书籍名称,组织机构名等)和主题规范,以达到规范化和标准化。
③在网络共享计算机硬件和软件资源。一般情况下,各个业务库可以使用所有图书馆自动化网络的全部或部分,但更侧重于联合编目,馆际互借和权限控制等。每个特定的网络具有不同的功能。
④联合目录查询,使用终端来检查网络是否藏在一个特定的文件,隐藏在库中。
⑤电子邮件,利用计算机网络进行通信大厅的电子邮箱服务的成员。
⑥联合编目成员馆使用的网络为中心的大型书目数据库,并取得产品目录在线目录,同时生成的工会大厅的中心的所有成员的目录(请参阅合作编目)。
⑦馆际互借,与联合目录,网络通过终端大厅的每个成员可以在网上馆际互借。
⑧采购协调,联合目录,以了解情况和西藏博物馆收藏功能协调采购政策及其成员图书馆和决定是否特定于采购文件。
ซ图书馆自动化网络如此强大的功能,在其运行的过程中势必出现无法解决的可靠性分析问题,数据挖掘网络诊断法应用于自动化网络故障诊断技术中,势必又会促使图书馆自动化网络技术产生进一步提升。
四、结语
总体而言,与传统图书馆相½比,图书馆的网络化具有巨大的发展潜力和优势。在大型网络库的可靠性分析各个环节的中,数据挖掘的网络诊断方法应用到解决这些问题的理论意义的可靠性和实用价值。但是,数据挖掘的网络诊断和组合应用到网络图书馆的建设的各个方面还需要长期艰苦的努力。因此,在联合过程中应由易到难,一步一步,最终建设势必成为高校发展过程中一颗灿烂的明珠。