基于支持向量机的消费者行为分类方法
摘要: “大数据”时代的来临,企业更加重视通过数据分析来洞察消费者行为,以实现更为精准的营销模式。现有对消费者行为的分类方法主要有层次分析法,聚类,贝叶斯网络等。文章引入支持向量机的方法应用在消费行为分析中,它是在统计学理论基础上发展起来的一种新的模式识别方法,在解决有限样本,非线性及高维模式识别问题中表现出许多特有的优势。最后,文章利用广东省烟草公司的实际调研数据进行支持向量机的训练。文章发现,相比于传统的消费者行为分类方法,支持向量机用于消费者行为分析是一种更精确有效的分类方法。
Abstract: This paper intensively studies the consumer behavior based on the "big data" era for the purpose of precision marketing. Nowadays, after reviewing the numerous literatures, the paper finds several approaches such as AHP algorithm, cluster analysis, Bayesian discrimination algorithm to solve these problems. However, this paper tries to use a new method named Support Vector Machine(SVM), which is a new pattern identification approach, to solve the complicated non-linear cases. Eventually, it uses Guangdong Tobacco case to certify the SVM algorithm, which is more accurate and feasible in this type than traditional consumer behavior analysis approaches such as the Bayesian discrimination algorithm.
关键词: 支持向量机;贝叶斯判别;分类;消费者行为分析
Key words: Support Vector Machine;Bayesian discrimination algorithm;classification;consumer behavior analysis
中图分类号:F253.9 文献标识码:A 文章编号:1006-4311(2015)04-0019-03
0 引言
消费者行为学在20世纪60年代中后期是一个相对较新的领域。随着“大数据”时代的到来,越来越多的学者意识到通过沉淀数据进行消费者行为分析的重要性。目前来讲,用于客户消费行为分析的主要方法有:层次分析法,聚类,贝叶斯网络等。
本次研究通过广东烟草的实地调研数据,利用支持向量机方法,区分低档品牌的购买群体行为模式、普通品牌的购买群体行为模式、高档品牌的购买群体行为模式。在研究过程中,首先是计算商品的价格分布,判断区分低档、普通、高档品牌,再利用二叉树多类分类方法与并行计算方法帮助提高支持向量机运算精度,利用Matlab构建一个平台进行支持向量机的训练与预测,并将该方法与贝叶斯判别的分类效果进行比较,判断支持向量机的分类精度。
1 基于支持向量机的烟草消费行为分类模型
支持向量机(SVM)是Cortes等人于1995年提出的,它在解决小样本、非线性以及高维模式识别中表现出许多特有的优势,并能推广应用到函数拟合等其它机器学习问题中。多分类支持向量机是众多算法中的一种。多分类支持向量机是将SVM从两分类算法推广到多分类的算法。常用的算法有一对多,一对一,二叉树,有向无环图四种。
1.1 模型设计 由于将烟草客户分类为:普通品消费者、低档品消费者、高档品消费者三类,所以选择合适的多类分类方法能有效地提高支持向量机。支持向量机的多分类问题往往由几个两分类问题来解决。商品品牌的分类结构示意如图1所示。
所以本论文选取一对一的多类分类方法结合二叉树分类来解决烟草消费者行为分析的分类问题,根据投票确定最后的分类结果。操作流程为:①收集到某个消费者的相关信息;②利用低档与非低档的支持向量机作为第一层SVM进行分类;③若分类结果为低档,则其低档的分类结构投一票;④若分类结果为非低档,利用普通与高档支持向量机继续为其分类,得到的普通或高档结果投一票;⑤将高档与非高档,普通与非普通作为第一层SVM重复②-④步骤;⑥根据最终投票结果,确定这个消费者的分类归属。
本次烟草消费者行为研究的数据规模较大,所以在这种大规模数据的条件下,必须采取有效的数据策略加快运算速度。所以在模型中并行计算方法为将总问题切割成小规模问题,利用计算机的并行技术进行求解。
期刊库(http://www.zgqkk.com),是一个专门从事期刊推广、投稿辅导的网站。
本站提供如何投稿辅导,寻求投稿辅导合作,快速投稿辅导,投稿辅导格式指导等解决方案:省级投稿辅导/国家级投稿辅导/核心期刊投稿辅导//职称投稿辅导。
【免责声明】本文仅代表作者本人观点,与投稿辅导_期刊发表_中国期刊库专业期刊网站无关。投稿辅导_期刊发表_中国期刊库专业期刊网站站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。
投稿辅导服务咨询与期刊合作加盟
陆老师联系QQ: 913775405(普刊)
蒋老师联系QQ: 867306987(核心)
刘老师联系QQ: 271374912(核心)
联系电话:18015016272
17327192284
投稿辅导投稿邮箱:zgqkk365@126.com
期刊推荐
- 《课程教育研究》 旬刊 国家级
- 《网络空间安全》(信息安全与技术)月刊 国
- 《价值工程》旬刊 国家级 科技统计源期刊
- 《高教论坛》 月刊 省级
- 《法制与社会》旬刊 省级
- 《中国教育学刊》月刊 14版北大核心
- 《语文建设》 旬刊 14版北大核心
- 《中国绿色画报》 月刊 国家级
- 《社科纵横》季刊 社科类优秀期刊
- 《求索》月刊 14版北大核心期刊
- 《财会月刊》旬刊 14版北大核心
- 《艺术品鉴》 月刊 省级
- 《中华建设》月刊 国家级 建设类优秀期刊
- 《教学与管理》旬刊 北大核心
- 《当代经济》 旬刊 省级
- 《新课程研究》旬刊 省级 教育类优秀学术期
- 《文教资料》 旬刊 省级
- 《学术界》 月刊 双核心
- 《吉林教育》旬刊 省级 教育类学术期刊
- 《中国农业资源与区划》 月刊 14版北大核心
- 《继续教育研究》月刊 北大核心期刊
- 《财经界(学术版)》半月刊 国家级
- 《电影评介》半月刊 14版北大核心
- 《公路交通科技》 月刊 北大核心
- 《新闻传播》月刊 省级 新闻类优秀期刊