1批发分销商销售状况及策略研究摘要本文针对批发分销商销售状况及策略的研究,使用描述统计、方差分析、判别分析等方法,分别构建描述统计对比分析模型、双因素方差分析模型、两总体距离判别模型、多总体距离判别模型,并利用Excel、Matlab等软件编程处理数据,得出了该批发分销商销售状况、影响因素以及有利的经营策略。针对问题一要求,给出该数据资料的基本分布状况、变量之间的相关程度或关联程度,以及批发商目前经营状况的评价。本文首先通过Excel对数据资料做基本的描述统计以及相关关系分析,可得出数据资料的基本分布状况以及变量之间的相关程度,再通过最描述统计结果的对比分析得出该分销商目前经营状况的评价。针对问题二要求,需分析不同销售途径、不同销售区域以及两者之间的交互作用是否会显著影响六大类商品的销售额,并最终找到影响六大类商品销售的主要因素。首先在Excel中对数据进行处理,再分别对销售途径和销售区域做无交互作用的双因素因素分析和交互作用的双因素分析,然后通过Matlab编程算出方差分析结果,分析后得出影响六大类商品销售的主要因素。针对问题三要求,需建立销售区域和销售途径的判别模型,并分析影响销售区域和销售途径的主要商品类别。其中销售途径可采用两总体距离判别方法得出销售途径的判别模型,并通过Matlab计算判别系数得出影响销售途径的商品类别;而销售区域可采用多总体的距离判别法建立销售区域的判别模型,并通过逐个剔除商品类别因素的方法计算误判率,用过Matlab计算得出判别系数和误判率,得出影响销售区域的主要商品类别,并综合分析得出批发销售商提供智慧的经营销售策略。本文最后还对模型进行了误差分析、评价和推广,并针对问题二中的方差分析所需的条件进行齐性检验,通过非参数检验对模型进行改进,使结果更准确。关键词:批发商销售策略;描述统计;方差分析;判别分析;Matlab2§1问题的重述一、背景知识1.总背景介绍批发分销商是指向制造商或经销单位购进商品,供给其他单位(如零售商)进行转卖或供给制造商进行加工制造产品的中间商。批发商的客户一般是销售公司或者大型零售商,不同的客户对批发商的需求不同,导致了批发商在不同客户不同销售区域和途径的条件下会有不同的进货组合。2.问题的产生随着市场的竞争的愈加激烈,批发分销商商需要更有效率的经营销售策略,但是经营策略需要对日常收集的数据进行大量分析和总结,但数据量多繁杂,无法直观地了解到想要的信息。3.已有的对策数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。统计分析是指运用统计方法及与分析对象有关的知识,从定量与定性的结合上进行的研究活动。它是在一定的选题下,集分析方案的设计、资料的搜集和整理而展开的研究活动。系统、完善的资料是统计分析的必要条件。将数据挖掘或多元统计的技术应用于商业领域,利用企业所积累的资料,透过相关变量的分析,找出顾客区隔、消费行为、业务成本与效率等对企业极为重要的资讯,为企业管理提供决策支持,从而提高企业经营的竞争力和商业智慧。二、相关资料1.Wholesalecustomersdata(B题附件)。三、要解决的问题1.问题一对该数据资料作描述统计,给出该数据资料的基本分布状况、变量之间的相关程度或关联程度,最终给出该批发分销商的目前经营状况的评价。2.问题二分析不同销售途径、不同销售区域以及两者之间的交互作用是否会显著的影响六大类商品的销售额,最终找到影响六大类商品销售的主要因素。3.问题三利用数据分析方法通过分别建立销售区域和销售途径的判别模型,分别找出影响销售区域的主要商品类别,影响销售途径的主要商品类别,最终为批发销售商提供智慧的经营销售策略。3§2问题的分析一、问题的总分析本文题为批发分销商销售状况的研究,即通过对该分销商历史销售数据的分析和研究,得出该分销商的经营状况、影响因素以及有利于经营销售的策略。该问题属于数理统计的内容,可采用描述统计、方差分析、判别分析的方法进行研究,整体框图如图1表示:图1整体框图二、对具体问题的分析1.对问题一的分析问题一要求对该数据资料作描述统计,给出该数据资料的基本分布状况、变量之间的相关程度或关联程度,最终给出该批发分销商的目前经营状况的评价。根据要求主要通过描述统计的方法对数据进行分析。首先通过Excel对数据资料做基本的描述统计以及相关关系分析,可得出数据资料的基本分布状况以及变量之间的相关程度,再通过最描述统计结果的分析得出该分销商目前经营状况的评价。2.对问题二的分析问题要求分析不同销售途径、不同销售区域以及两者之间的交互作用是否会显著的影响六大类商品的销售额,最终找到影响六大类商品销售的主要因素。可通过无交互作用的双因素因素分析和交互作用的双因素分析,找到影响六大类商品销售的主要因素。3.对问题三的分析问题三要求利用数据分析方法通过分别建立销售区域和销售途径的判别模型,分别4找出影响销售途径和销售区域的主要商品类别,最终为批发销售商提供智慧的经营销售策略。其中销售途径可可采用两总体距离判别方法得出销售途径的判别模型,并通过所得线性判别函数中定影响销售途径的商品类别;而销售区域可采用多总体的距离判别法建立销售区域的判别模型,并通过逐个剔除商品类别因素的方法计算误判率,得出影响销售区域的主要商品类别。并通过对上述判别模型和影响因素的研究,综合分析得出批发销售商提供智慧的经营销售策略。§3模型的假设1.假设六大类商品商品销售额相互独立;2.假设模型Ⅳ中,三总体协方差矩阵差异可以忽略,并且不会造成显著误差§4名词解释与符号说明一、名词解释1.描述统计:是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。[1]2.数据分析方法:数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据也称观测值,是实验、测量、观察、调查等的结果,常以数量的形式给出。[2]二、主要符号说明序号符号符号说明1x平均值22s方差3s标准差4r相关系数51g偏度62g峰度7i水平iA对指标的效应8j水平jB对指标的效应9ij水平iA与jB对指标的交互效应10),(Gxdn维向量x与总体G的马氏距离11总体的协方差矩阵12p回带误判率5§5模型的建立与求解一、问题一的分析与求解1.对问题的分析问题要求对该数据资料作描述统计,给出该数据资料的基本分布状况、变量之间的相关程度或关联程度,最终给出该批发分销商的目前经营状况的评价。我们利用Excel自带的数据分析功能对数据进行进行处理,并对结果进行对比分析,得出经营状况的评价。2.对问题的求解模型Ⅰ描述统计对比分析模型⑴模型的准备描述统计是将收集到的数据用一些概括性的统计量以及图形、图表加以描述,它将数据本身包含的信息加以总结、概括、浓缩、简化,使问题变得更加清晰、简单、易于理解。通过试验和观察得到数据nxxx,,,21。这些数据是带有随机性的数据.为统计分析目的,数据被分为定性(有序的和名义的)数据和定量(计量和计数的)数据。本文中将保鲜品、乳制品、杂货产品、冷冻开支、洗涤剂和纸制品、熟食产品、销售途径以及销售区域作为8组数据进行描述统计和相关性分析。⑵模型的建立①平均niixnx11它是数据集中趋势的度量,反映了数据的平均水平。其优点是能反映每个数据的作用,缺点是易受数据中极端值的影响。②方差njixxns122)(11样本均值是总体均值的无偏估计。③标准差标准差是方差的平方根,方差与标准差越大,意味着数据的分散程度越大;相反,方差与标准差越小,意味着数据的分散程度越小,也即向平均值的集中程度越高。方差与标准差度量了数据的离散程度。④中位数中位数以其排列位置来描述集中趋势,比中位数大(小)的数据各占整个数据的一半。其优点是不受个别极端值的影响,具有稳健性,缺点是缺乏敏感性。⑤众数众数是指在数据中出现次数最多的数据值,是衡量定性数据集中位置的重要量度。⑥偏度6偏度和峰度是刻画数据分布形态的两个统计量,它们与数据的矩有关。数据的矩分为原点矩和中心矩。k阶原点矩nikikxnA11k阶中心矩nikikxxnB1)(1偏度的计算公式为niisnnBnxxsnnng1332231)2)(1()()2)(1(偏度是描述样本数据对称性的统计量。关于均值对称的数据,其偏度为0,数据的右侧较左侧更为扩展,偏度为正,反之,数据的左侧较右侧更为扩展,偏度为负。⑦峰度的计算公式为)3)(2()1(3)3)(2)(1()1()3)(2()1(3)()3)(2)(1()1(24221442nnnsnnnnnnnnxxsnnnnngnii峰度是以正态分布为标准,来描述数据向分布尾端散布的趋势。近似于正态的分布,其峰度接近于0。尖峰式分布(峰度为负),标准正态分布(峰度为0),扁平式分布(峰度为正)。⑧标准误差标准误差一般用来判定该组测量数据的可靠性,在数学上它的值等于测量值误差的平方和的平均值的平方根。标准误差在正态分布中表现出正态分布曲线的陡峭程度,标准误差越大,曲线越平坦,反之,曲线越陡峭。⑨相关系数niniiininiiiniiniininiiiniiiyynxxnyyxxnyyxxyyxxr12121212121211221)()()()()()())((相关系数是用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。⑶模型的求解调用Excel描述统计功能,对数据进行描述统计结果如表1和表27表1描述统计结果表描述统计量ChannelRegionFreshMilkGroceryFrozenDetergentsPaperDelicassen平均1.3227272.54318181812000.35796.2667951.2773071.9322881.4931524.87标准误差0.0223130.036911991602.9377351.8457453.0455231.4375227.2985134.4433中位数13850436274755.51526816.5965.5众数13336611962062425918834标准差0.4680520.77427244912647.337380.3779503.1634854.6734767.8542820.106方差0.2190720.5994978261.6E+08544699679031010423567853227324367952997峰度-1.42746-0.10011083511.5364124.669420.9146754.6892819.00946170.6949偏度0.760951-1.283626932.5613234.0537553.5874295.9079863.63185111.15159区域121121487344392777608444082447940最小值1135532533最大值231121517349892780608694082747943求和582111952801312550357349856213516501267857670943观测数440440440440440440440440最大(1)231121517349892780608694082747943最小(1)1135532533置信度(95.0%)0.0438550.0725461761185.003691.5113890.4077454