探讨关联规则挖掘在汽车营销决策中的应用

时间:2024-11-10 09:01:27 来源:作文网 作者:管理员

摘要:通过对汽车销售历史数据进行概化和总结,给出关联规则挖掘算法,并针对具体的事例加以分析,进行各个客户购买属性之间的关联规则的挖掘。可以有效地发掘顾客购买行为和汽车属性之间蕴藏的内在联系。此模型可以用于辅助汽车营销决策。

关 键 词:交通流分析;关联规则;数据挖掘

1 引言 2 汽车营销分析的关联规则算法

关联分析的目的是找出数据库中隐藏的关联网。有时并不知道数据库中数据的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度[2 ] 。 在汽车营销分析中,可用R = { I1 , I2 , I3 , I n} 来表示各种购买属性的项目集合,事物T 可以用来表示购买同一品牌的客户的各个属性之间的联系。

关联规则的挖掘问题就是在事务数据库中找出等于用户给定的最小支持度 和最小可信度 的规则。此问题可以分解为2 个步骤: m- sup ,数据库中的事务集输出:

频繁集R 以及它们的支持度Xki表示Ck 集合里面的每一个子项,包括支持度。

L k 集合存放的是Ck 集合中所有满足支持度大于m- sup 的全体项集和支持度图1 寻找频繁集的算法流程图3 关联规则具体实例在客户信息数据库中,有客户的客户类型、年¿龄、收入水平、文化水平、家庭住址区等,要研究这些客户属性和客户购买的车型之间的关系,需要对客户信息进行抽象概化。 A { A 1 , A 2 , A 3 , A 4 , A 5 , A 6 , A 7 , } ,分别表示海淀、宣武、朝阳、丰台、昌平、崇文、西城。

根据表1 ,可以得出客户信息数据概化。

3. 2 关联规则算法的应用 和关联规则算法,可以进行客户的各种属性和购买车型之间的联系分析 假设,要研究购买车型为低档轿车的客户的文化水平、收入水平以及年龄之间的联系,并且关联规则的支持度必须> 30 % ,可信度要≥90 %。

首先寻找频繁集的算法,得出支持度> 30 %的所有频繁集如图2 所示。

找出可信度≥90 %的关联规则根据可信度的定义Confidence = P ,得出可信度计算结果。

购买20 万以下价位车的客户当中,文化水平为本科的客户年龄一般是30~50 岁。

购买20 万以下价位车的客户当中,一般是收入水平为3000~5000 ,年龄为30~50 岁的客户。

购买20 万以下价位车的客户当中,收入水平为3000~5000 的客户,文化水平为本科。

购买20 万以下价位车的客户当中,收入水平为3000~5000 并且文化水平为本科的客户,年龄为30~50岁。

得出这些规则之后,可以进一步研究这些规则产生的内在原因。

同样,如果❦要分析购买高价位轿车的客户的各个属性相互之间有什么关联规则。只要从事务集中找出和Z3相关的事务,并进行分析,根据上述的运算规则,就可以得出客户属性之间的各个关联规则。

4 结论与展望

通过对汽车销售历史数据进行概化和总结,给出关联规则挖掘算法,并针对具体的事例加以分析,进行各个客户购买属性之间的关联规则的挖掘。可以有效地挖掘顾客购买行为和汽车属性之间蕴藏的内在联系。此模型可以用于辅助汽车营销决策。为了提高关联规则挖掘的效率和速度,可以对关联规则挖掘的算法进一步完善。

参考文献: [ 2 ] 陈文伟. 决策支持系统及其开发 [M] . 北京:清华大学出版社,2000.

[ 3 ] 王珊编着. 数据仓库技术与联机分析处理[M] . 北京:科学技术出版社,1999.

[4 ] 高人伯,陈文伟. 数据仓库和数据挖掘相结合的决策支持新技术[A] . 计算机世界专题综述[ C] ,北京:计算机世界,1997.ツ

[ 5 ] Tom Hammergren ,曹增强,王备战译. 数据仓库技术[M] . 北京:中国水利水电出版社,1998ก.

[ 6 ] 朱♚明. 数据挖掘[M] . 合肥:中国科学技术出版社,2002.

[ 7 ] 石丽,李坚. 数据仓库与决策支持[M] . 北京:国防工业出版社,2003.

[ 8 ] [加]J iawei Han ,Micheline Kamber. 数据挖掘概念与技术。


热门排行: 教你如何写建议书