解读BI在汽车销售中的数据分析
四、决策树技术在汽车销售中的应用
下面将就某汽车销售公司,在汽车展上的调查问卷进行分析。

潜在客户的数据主要有年龄、性别、职业、收入、教育程度、是否结婚,是否有房等,调查客户是否会在一年内买车。数据表格式如下: 1.数据预处理。数据预处理的目的是为了提高数据质量,使数据挖掘的过程更加有效,更加容易同时也提高挖掘结果的质量。数据预处理的对象主要是清理其中的噪声数据、空缺数据和不一致数据。常用的数据预处理技术主要包括;数据清洗、相关分析和数据变换等。 数据清洗试图填补训练集中的空缺值、识别孤立点、消除噪声、纠正数据中的不一致。对于空缺值的处理,通常有忽略元组、人工填写空缺值、使用全局常量填充、使用属性平均值填充、使用与给定元组同一类的样本平均值填充、使用最可能的值填充等方法。
调查问卷中有部分没有填写的选项,如年龄属性,对于这一部分记录采用的是使用属性平均值填充的方法。在进 行 数 据挖掘工作之前需要进行前期的数据整理工作,比如根据直观经验去除数据中的冗余信息或不相关信息,对于上面的数据集中的属性,像序号等可以在正式开始数据挖掘前去除,因为客户是否近期内买车是我们最关心的信息我们把属性是否 一年内买车,即作为类标签属性。
2.生成决策树,产生规则。整理后的数据导入到DB2关系数据库表中,使用IBM的Intenlig entM iner提供的数据挖掘工具生成决策树并剪枝后。
3.决策树结果分析理解。需要说明的是这203份问卷是在车展中获取的.来参加车展接受问卷调查的自然多数是有买车想法的,因此31.2%愿意买车.这个比例在普通人群中是达不到的。下面我们从产生的决策树规则分析一下是否在一年内买车与客户的因素之间的关系。
(1 )收入直接决定了一个人的购买力。salary即月薪在低于2550元的客户中汽车是奢侈品.在近期一年内没有购车的意愿;月薪在高于6500元的客户中,一年内也没有购车的意愿可以想象高收入人群大多已经有车了。
(2) 年龄也是导致买车的一个因素。在接受调查的人群中都在22岁一65岁之间。年轻人中愿意买车的较多年龄小于31.5岁的人,可能是由于婚姻与购房所困,一年内没有购车的意愿:年龄在31.5岁一40.5岁之间(占82.3%),一般来说这一部分高收入人群不受房子与婚姻状况所困扰孩子大多在上中小学.而目前大多数是独生子女,社会治安又不太好在经济条件许可的情况,会考虑买车来接送孩子。因此有近期买车的打算。
(3) 愿意买车的多为男性。在低收入的女性中没有考虑购车问题.但男性如果收入还可以的情况下有近期买车的可能性。
(4) 从目前 这些数据来看受教育情况、婚否、工作性质与是否愿意近期买车影响也不大。客户的购 买行为还要从多方面进行考虑我们仅从这几方面挖掘出外部环境与客户的购买行为之间的关系。在计划购车的人群中购车的价位,车的排气量、/车的颜色等也可以进行挖掘在不打算购车的人群中不买的原因,也值得分析。
五、结论
采用决策树分类算法,通过对调查数据挖掘得到一系列的分类规则,然后利用此分类规则对潜在客户进行分析采取主动营销.可以降低营销成本从而可以提高营销的成功率。随着多方面大量数据的获得,商业智能的数据挖掘工具可以挖掘出更有参考价值、易于理解,并具有很高的分类准确度的规则为生产实践服务。决策树数据挖掘技术在汽车销售中也有着广阔的应用前景,值得我们进一步的研究。
集成系统网络情报信息数据库
CIO频道人物视窗
CIO频道方案案例库
大数据建设方案案例库
电子政务建设方案案例库
互联集成系统构建方案案例库
商务智能建设方案案例库
系统集成类软件信息研发企业名录

