电商平台下用户画像的设计与实现THEDESIGNANDIMPLEMENTATIONOFUSERPROFILEONE-COMMERCEPLATFORM专业:计算机科学与技术姓名:史维君指导教师:申请学位级别:学士论文提交日期:2016年6月1日学位授予单位:天津科技大学I摘要大数据是数量非常巨大的复杂的半结构化或者非结构化的数据集。随着时代的发展,越来越多的数据产生,用传统的数据库管理方式,无论是从数据的储存,获取,或者查找等方面都已经无法满足要求了。随着大数据的来临,人们有了解决大量数据的处理,储存等能力后,人们为了将数据细化,将数据分行业,类型的分了好多种类。在这里我们所研究的是其中的一个种类:用户画像。用户画像核心价值在于了解用户,猜测用户对产品的需求或者潜在需求,精细化的定位人群特征,挖掘潜在的用户群体,为媒体网站、广告主、企业及广告公司充分认知群体用户的差异化特征,根据族群的差异化特征,帮助客户找到营销机会、运营方向,全面提高客户的核心影响力。在电商行业中。用户画像可以分析客户的使用习惯、喜好、一系列的购买行为,以及周边的人群的身份、属性、年龄等,它对我们的商务行为、对营销的判断会有一定的借鉴。本文通过使用Hadoop技术,结合Hive,Java,JSP和HTML等编程语言,设计并完成了一个具有简单的电商平台下的用户画像。本设计依赖Easyui,Echarts,JfreeChar框架设计出了简洁漂亮的前端界面,使用Hive进行数据分析与产生研究结果。本系统主要包括,系统管理:分别从用户管理,角色管理,菜单管理等方面对整个系统进行权限管理。用户行为:分别从跳出率,忠诚度,活跃度判断用户在某一天或者某一段时间的整体状况。访客分析:分别从地域分布,速度分布,客户端环境等对某个地区的整体环境和地区消费情况进行产品销售。关键词:用户画像;Hadoop;HiveIIABSTRACTBigdataisaverylargenumberofcomplexsemistructuredorunstructureddatasets.Withthedevelopmentofthetimes,moreandmoredataareproduced,withthetraditionaldatabasemanagement,whetheritisfromthedatastorage,access,orfindandsoonhavebeenunabletomeettherequirementsofthe.Withtheadventofbigdata,peoplehavetodealwithalargenumberofdataprocessing,storageandothercapabilities,peopleinordertorefinethedata,thedatapointsindustry,alotoftypesofpoints.Whatwearestudyinghereisoneofthecategories:theuserportrait.Userportraitcorevalueistounderstandtheuser,usersoftheproductdemandorpotentialdemandforecast,finepositioningpopulationcharacteristics,miningthepotentialusergroups,webmedia,advertisers,andadvertisingcompaniesfullycognitivedifferentiationcharacteristicsoftheusergroups,accordingtothefeaturesoftheethnicdifferencestohelpcustomersfindopportunitiesformarketing,operations,andcomprehensivelyimprovethecustomer'scoreimpact.Intheelectricitybusinessindustry.Userportraitcananalyzecustomerusehabits,preferences,aseriesofpurchasebehavior,andperipheralpopulationsofidentity,attributes,age,ittoourbusinessbehavior,thejudgmentofthemarketingwillhaveacertainreference.ThisarticlethroughtheuseofHadooptechnology,combinedwithHive,Java,JSPandHTMLprogramminglanguages,designedandcompletedasimplebusinessplatformwithauserportrait.ThedesignofEasyui,Echarts,JfreeCharframeworkdesignedasimpleandbeautifulfrontinterface,usingHivefordataanalysisandresearchresults.Thesystemmainlyincludesthesystemmanagement:fromtheusermanagement,rolemanagement,menumanagementandotheraspectsoftheentiresystemtocarryouttherightsmanagement.Userbehavior:respectively,fromthejumpoutrate,loyalty,activitytojudgetheoverallsituationoftheuserinadayoracertainperiodoftime.Visitoranalysis:fromthegeographicaldistribution,speeddistribution,clientenvironment,suchastheoverallenvironmentofaregionandregionalconsumersales.Keywords:UserProfile;Hadoop;HiveIII目录第一章引言..............................................1第一节用户画像的背景及意义............................1第二节系统所用的开发技术及工具简介....................2第三节系统环境搭建....................................3第四节论文整体设计结构................................6第二章系统需求分析与概要设计............................8第一节用户画像的需求分析..............................8第二节可行性分析......................................9第三节系统总体结构设计...............................10第四节系统功能模块设计...............................13第三章系统的详细设计与实现.............................16第一节数据仓库建模...................................16第二节系统部分功能模块流程图设计.....................25第三节部分功能模块的实现说明.........................28第四节系统结构和页面详细设计.........................32第四章系统测试.........................................36第一节软件测试的目的.................................36第二节测试的方法及步骤...............................36第三节系统部分功能测试和结果.........................37第五章论文总结和今后展望...............................41IV第一节总结...........................................41第二节展望...........................................41参考文献................................................42致谢..................................................43天津科技大学2016届本科生毕业设计1第一章引言随着互联网时代的来临,人们越来越重视对数据的利用与处理,在海量数据中提取有效信息,进行数据分析与挖掘发现商业价值[1]。用户是时代发展的最重要的因素,利用大数据来分析用户的行为与消费习惯,可以预测商品的发展的趋势,提高产品质量,同时提高用户满意度[2]。本文基于大数据与Hadoop技术进行电商用户画像的开发与设计,论文将从国内外研究,需求分析,系统概要设计,系统详细设计,系统的实现等方面进行整个项目的描述。第一节用户画像的背景及意义随着大数据兴起与不断发展,数据量越来越来,人们想着从这些数据中挖掘出自己想要的信息。所以有了各种各样的数据挖掘方式或者种类并将其抽象到各个行业。再次我们讨论的是其中的一个种类,用户画像。在“用户中心论”理论支持下,很多行业意识到用户的重要性,在整个社会发展的过程中用户是主导因素[3]。所以有很多行业从原来以产品和服务为中心的思维方式转换到以用户为主导,开始研究用户的需求,反馈和用户满意度等信息[4]。互联网行业也是如此,互联网企业开始加深对用户的了解。为了使生产或销售的产品能够吸引更多的新用户,同时留住老用户,提高企业的利润,基于用户的研究越来越重要了[5]。在很多传统行业中,商家为了提高用户量,经常会分析用户的生命周期和价值,用户的忠诚度,地域等信息来进行商业决策[6]。比如电商行业,商家会对用户的年龄分布,地区,性别,星座,消费能力,家庭收入的方面对用户进行分析,判断用户将来会给商家带来的利润,来进行商业决策[7]。再者分析用户的整体消费情况可以了解用户的消费偏好,进行商品的推送服务,例如:短信推送,邮件推送等。这样就形成了比较成熟的用户行为与消费习惯分析体系,为商家如何长远的获得利益与吸引新用户打下坚实的基础。随着互联网行业的不断发展,人们对网上消费人群的分析越来越重要。例如很多大型互联网企业都推出了自己的分析体系,例如:百度,谷歌,阿里和京东等。京东将在电子商务全过程中的所有用户的数据都添加到用户画像的建模当中,而且对用户进行全方位的精确定位,描绘用户的特征。目前京东的用户画像中运用大约三百多个标签来描述客户,涵盖了用户的基本属性,购买能力,偏好等各个方面,利用分析的结果来推荐产品,广告等,同时也更加智能的设置搜索提示功能,更好的服务于用户,来提高用户的满意度[8]。天津科技大学2016届本科生毕业设计2第二节系统所用的开发技术及工具简介一、开发技术简介(一)Java与JavaEE简介Java是一种与C++相似的面向对象编程语言,但它比C++功能更强大、学起来更为简单,而且它具有简单、安全、高性能、面向对象、高可移植性以及跨平台性等优点,因而受到了广大编程人员的追捧。同时由于其具有其强大的平台无关性,所以用Java开发的应用程序可以在各个系统平台上运行,这使得Java成为目前应用范围最广的编程语言[9]。JavaEE是一套用