基于用户偏好的多特征融合个性化图书推荐模型研究

时间:2024-12-26 02:05:19 来源:作文网 作者:管理员

引言

随着时间的推移,图书馆的资源越来越多,随着网络技术的发展,图书馆开始从传统的纸质图书的阅读服务转到数字信息资源的服务。图书馆的管理工作也开始自动化、数字化和信息化。对于图书馆来讲,数字化发展之路已成为未来发展的必然趋势。数字图书馆可以为用户提供更好的信息服务,可以有效地实现不同类型、不同位置的信息资源7*24服务模式。但是互联网的发展,使得数据量变得越来越大,正在以几何级数的速度增长。用户如何从大量的信息资源中获取有用的资源已成为一个现实问题。数字图书馆是为用户提供数字资源的,解决用户对于信息服务的日益增长的需求,目前的数字资源的服务模式并不完善,用户而对的各种信息资源不断增加,但信息资源的准确性仍然不是很理想。因此个性化图书馆服务将成为未来图书馆主要的服务方式,是图书馆提高服务质量和服务水平的重要途径。

上世纪90年代,个性化推荐技术被提出来,然后各国学者对此进行了大量的研究,并取得了相当好的成果,然后被应用到电子商务网站中,创造了巨大的经济价值。但总的来讲,现有的推荐系统存在一些问题,主要包括:一是推荐质量的评价,还没有一个很好的指标来评价推荐系统的推荐质量;二是冷启动问题,即对新加入的用户或商品如何推荐的问题;三是效率和实时性问题;四是用户交互问题。随着数字图书馆的发展和读者个性需求的发展,个性化推荐技术逐渐被应用到图书馆领域,个性化推荐技术中最为成熟的是协同过滤推荐技术,通过图书或读者之间的相似性,产生图书或读者之间的最近邻居,再由最近邻居向目标读者推荐相ศ似图书。但是这种算法复杂度大,其推荐质量受多种因素的影响,推荐质量不高。针对这一问题,本文提出一种基于读者偏好的多特征融合的个性化图书推荐算法。个性化图书推荐[是根据已有的数据挖掘出相关规律,用找到的规律来对不同类型、层次的读者推荐相关的图书。图书管理系统经过多年的运行积累了大量的借阅数据,这些借阅记录是产生关联规则的重要数据来源,因此个性化推荐系统与原有的图书借阅系统密不可分。同时这些记录也有效体现了不同读者的偏好特征。

1个性化推荐算法及相关技术

个性化推荐的核心是推荐算法。随着技术的发展,各种各样的推荐算法被提出来。目前常用的推荐算法主要包括基于内容的推荐算法、基于历史行为的推荐算法和基于模型的推荐算法

个性化推荐技术可以帮助读者从大量的数据海洋中准确、高效地获取所需要的信息。目前比较成熟的推荐技术主要有以下几种:

①基于关联规则的推荐技术:其原理是通过分析用户当前的兴趣受好或访问记录进行规则提出,寻找有意义的关联组合,然后按规则方式向用户推荐其可能感兴趣的信息资源。常用的关联规则方法有Apriori算法以及基于Apriori算法改进的FP-Growth算法等。

②基于内容过滤的推荐技术:基于内容的推荐在本质上是信息过滤技术的延续和发展。系统无须获取用户对项目的评价意见,而仅仅通过学习用户的对历史选择项目的内容信息,来进行新项目的推荐。由于基于内容的推荐算法的根本在于信息提取和信息过滤,属于文本处理的研究范畴,理论上的研究也比较成熟,因此现有很多基于内容的推荐系统都是通过分析产品的文本信息进行推荐的。最常用方法就是信息过滤中TF-IDF算法。

③协同过滤推荐技术:协同过滤也称社会过滤,通过计算用户间偏好的相似性:找到与当前用户相似的其他用户来计算对该用户的效用值,利用该效用值对对象进行排序或加权操作,从而找到最合适的推荐对象.其基本思想为具有相同或相似的价值观、思想观、知识水平和兴趣偏好的用户,其对信息的需求也是相似的[poi。因此相对于传统的推荐方法,协同过滤技术体现出的一个显著的优势是对推荐的对象没有特殊要求,对于一些难以进行内容分析的抽象项目,比如信息质量、个人品味等也能够实现推荐。

协同过滤推荐是利用用户间的偏好相似性来进行推荐,并且推荐过程是完全自动完成的,不需要用户通过填写调查表等方式来明确自己所感兴趣的信息。

④混合推荐技术:各种推荐方法都有其优缺点,并且在一定程度上具有互补性,因此在推荐系统中组用组合推荐策略的方式来对用户进行推荐,往往会得到较好的推荐结果。尽管组合策略有多种,但常用的方式是将协同过滤和基于内容的推荐技术相结合来解决特定的问题。因此在党组织合推荐策略中最重要的原则就是根据实际情况选择合适的组合方式,通过扬长避短,以取得最优推荐结果。常用的组合思路有七种=,分别是:加权、变换、混合、特给组合、层叠、特征扩充、无组别等七种。

2基于用户反馈的个性化图书推荐模型构建

2.1模型构建

个性化推荐技术是个性化定制服务的一种。各种个性化技术都有各自的优缺点和适用范围。从用户的角度出发,基于内联规则、内容的推荐技术和协同过滤推荐技术,构建了一个新的个性化图书推荐模型。

①基础数据:个性化推荐需要基础数据支撑,这些数据包括图书资源信息、读者信息和读者借阅信息。这些信息均可以从图书管理系统中直接获取。

②个性推荐模型:针对大量的图书信息、读者借阅信息和读者信息,通过读者相似性分析,寻找相似读者的借阅ฬ历史;通过图书信息库寻找同类图书;通过借阅信息库,寻找读者偏好的图书,从而形成用户模型库和图书信息库,进一步形成个性化推荐模型。

③数据挖掘:数据挖掘的目的就是从大量的数据中找到有关、有价值的信息。根据加权的规则把读者偏好的图书与相似读者的阅读历史的图书相综合,通过排序的方式形成此读者的推荐列表,完成推荐工作。

而这所有的工作都依赖于读者特征和图书特征的提取及相似性分析。

2.2特征提取

影响读者借阅的主要因素有三个方而,分别是图书特征、读者特征和借阅信息。对图书特征来讲,可以把图书分成不同的类别;对于读者特征来讲,可以通过数据挖掘方法把读者分成不同的类别;把借阅信息通过数据挖掘方法可以有效查找到读者偏好的图书。因此三类特征的提取是关键。

2.2.1图书特征

图书馆的任意两本图书之间都有一定的相似性和相异性,这是影响向读者推荐图书最为重要的因素。图书特征又可分为一次特征和二次特征。一次特征即可以直接从图书的基本信息中提取的特征;二次特征指通过对基础数据分析提取到的特征。

一次特征主要包括:图书的索引号、分类号、总页数、被借阅次数、出版日期、在架的复本数等。它们影响读者借书和借阅时间长短的因素。

二次特征主要指图书的受欢迎程度,通过对读者的借阅记录分析得到的特征。因为大部分图书馆系统均没有图书评价功能,即使小部分图书馆系统有相应的功能,也很少有读者进行评价,因此图书的受欢迎程度难以定量评价。为了更好地定量评价,采用图书的每页图书的借阅时间来评价,即一本图书被读者借阅的所有时间总和与图书的总页数之比。

2.2.2读者特征

不同的读者借阅的图书通常不一样。读者的历史借阅记录可以最好地反映读者的借阅习惯,未来一段时间内读者很可能还借阅与已借阅相类似的图书。同时由于各读者的专业、年级、学历不同,读者借阅与专业、年级、学历的关系也较大。因此影响读者借阅的因素主要包括:专业、年级、性别、学历、学术兴趣等因素。可以用向量表示用户属性集合。

2.2.3基于借阅记录特征

图书特征和读者特征都是一些基础特征,个性化的推荐技术关键是在图书特征和读者特征的基础上,通过分析读者的借阅记录,进行有针对性的推荐。采用k一近邻方法对读者借阅记录进行分析,挖掘读者的个性偏好,形成不同的读者群体。不同群体的读者往往有不同的借阅习惯,但同类群体的读者往©往有相同的借阅偏好,会借阅相同类型的图书。因此同类读者中其它读者借阅过的图书也是最可能借阅的。

2.3个性化推荐的基本流程

根据个性化推荐模型,设计了一个个性☪化推荐流程。个性化图书的推荐流程是根据基础信息库中的用户信息、图书信息、借阅记录的数据挖掘分析和当前登录用户的信息进行查找读者所属类别和读者的借阅记录,然后形成推荐图书,返回给读者,以实现个性化推荐的目的。

3实验验证

基于用户偏好的个性化图书推荐模型地,系统通过B/S模型,采用MYSQL数据库、javal.6+tomcat 6.0开发。包括三个大模块,一个是基础数据模块;二是个性化推荐库模块;三是用户推荐模块。

3.1基础数据模块即数据获取与预处理

基础数据模块的数据进行初始化和预处理,保证全部数据的真实、可靠、完成;其次是通过数据挖掘方法对基础数据分析,根据个性化推荐模型,形成个性化推荐库;最后是根据当前登录用户,进行个性化推荐ว读者期望的图书。

根据读者的特征、图书特征和借阅记录,从南昌某大学图书馆管理系统中,提取2008-2013年的读者借阅数据、读者数据和图书数据。

3.2性化推荐库模块即数据的分析

对图书数据,根据中图分类法进行相似性分类;对于读者,根据读者特征和借阅记录利用K-MEAN方法进行读者聚类,共分10类)

3.3用户推荐模块即用户接口

通过B/S方式,给读者展现一个清晰、友好的交互式页而)通过用户登录,获取用户基木信息,根据个性化推荐模型向读者推荐相应的图书,默认推荐前50木图书,分页显示)同时用户可以根据自己的需要进行二次检索,以提高推荐的成功率)

4结论

随着信息技术和数字化图书馆的发展,图书馆在科研、教育领域发挥着越来越重要的作用。而如何提高服务质量、提高用户满意度,个性化服务成为必然趋势。个性化信息服务能够向图书馆用户提供满足其个性化需求的信息内容和特定功能服务,受到了业内人士的广泛关注和极大兴趣,是目前图书馆领域中非常有意义的研究内容。通过对用户信息、图书信息和用户借阅信息的分析、借用数据挖掘方法,构建了一个用户兴趣库和图书聚类库,然后通过个性化推荐模型,通过多方法加权的方式为用户推荐其所需要的图书,通过个性化推荐系统的实施,获取了较好的结果。但还存在一些问题,包括随着数据量的增加,效率在降低,在今后的研究工作中还需要不断的完善和改进。


热门排行: 教你如何写建议书