课程名称:实用商务数据分析与预测小组成员:陈玉洁、武晓威、李茗芝、李贞玟、霍华蕾指导老师:王汉生1非学位职业培训机构学院数据分析背景介绍非学位职业培训主要是以在职人员为主要对象、以管理科学和管理技术为主要内容、以面授、影音和书籍为载体、以赢利为目的的商业行为。,可以粗略的分为:个体户,围绕核心讲师组建的管理咨询公司,如北京光起管理咨询公司、北京惠智管理咨询公司、上海惠泉管理咨询公司等。演化型,在核心业务基础上延伸出培训服务的机构,如前程无忧人才网,海尔大学,新闻传媒集团的培训业务等。中介型,依托目标地区市场需求或自有社会资源而创建的培训机构,没有自己固定的讲师。这样的培训机构遍布市场。营销型,以培训作为产品营销手段的非培训公司的培训业务,如推广ERP等软件的ATM研究院等。产品型,以成功学、拓展训练、沙盘模拟等非讲师主导的培训产品为核心业务的培训机构。综合型,独占一些讲师资源并中介部分讲师的综合型培训公司。每一个类型都包括以市、省或全国为目标地区的机构。培训机构、讲师和客户是非学位培训行业的三种核心力量,三者的力量对比关系决定着培训业的运营模式。由于三者的分布非常广泛,每一群体都包括实力、规模等差异巨大的众多个体,所以培训业的运营模式复杂多变,产品名目繁多、培训机构形式各异、讲师良莠不齐、竞争态势犬牙交错。研究非学位培训产业有三个方面:一、判断需求是非学位培训业的首要任务—购买动机把管理科学和工程技术相比较:为什么没有机械设计培训行业呢,为什么没有众多的投资者成立“机械设计”培训公司呢?因为工程技术是普适的,国家有强制的或指导的标准,市场无机可乘。管理学不同,管理学没有普适的技术标准或定理体系,管理者面对残酷的市场竞争往往无所适从,他们渴望寻找信念支撑和成功的工具,这种渴望孕育了非学位培训业。非学位培训界推广这样的逻辑:购买我们的产品,你就会成功;你没有成功是因为你购买课程名称:实用商务数据分析与预测小组成员:陈玉洁、武晓威、李茗芝、李贞玟、霍华蕾指导老师:王汉生2的不够多。所以,非学位培训业之所以能够存在,与其说是因为有对知识的需求,不如说是因为有对赢利的渴望。从事非学位培训的投资者不断让人们相信,“学习”是一根救命稻草。人们渴望财富、渴望成功、渴望赢得竞争的心理,是非学位培训市场需求的根本。二、品牌是客户选择非学位培训的核心指标—购买行为客户选择购买何种非学位培训产品的因素很多,其核心指标是权威性或对产品销售机构的信任。权威性包括客户对国立高等学府的自然认可,对讲师履历的认可,对跨国公司培训机构的认可等方面;信任主要包括对培训机构的品质信任。这些可以归为“品牌”因素。在目前的培训市场,品牌资源几乎完全集中于商学院和部分高履历讲师。三、管理科学是非学位培训的核心内容—持续购买存在一种可以通过学习获得并实践有效的广泛的管理知识体系或经验体系吗?或者我们降低标准,存在一种针对特定地区、特定行业、特定规模企业、特定管理岗位(例如,寿险业务员)的唯一有效的管理技术和理论吗?我们看到管理是非常强调情景和实践的行为,实践对理论的指导意义更大,而且并不存在唯一有效的方法。另一方面,非学位培训业持续发展的核心能力是真正帮助客户获得成长,培训机构能够获得发展的唯一长久有效方式,是为特定的目标客户提供个性化的服务,包括课程设计、讲师选择、品质承诺等。让客户持续购买,就必须针对拥有的讲师资源寻找合适的目标客户,或根据目标客户的需求寻找合适的讲师,这是培训机构的核心业务。以上对非学位职业培训的背景做了简单介绍。接下来我们将对非学位职业培训机构学院的课程平均成绩与其他因素之间的关系进行分析。指标设计我们对某年度随机抽取的178名已结业的学院数据进行分析,其中因变量为学员的课程平均成绩,解释性变量有五个,分别是:性别(X1)该指标刻画了学员的性别区别,分为男女两个取值,希望通过分析判断出性别是否是影响学员平均成绩的因素。出生年代(X2)参加非学位职业培训的人员年龄差异比较大,这里我们根据原始数据中学员课程名称:实用商务数据分析与预测小组成员:陈玉洁、武晓威、李茗芝、李贞玟、霍华蕾指导老师:王汉生3的出生年月日将学员分为不同的出生年代,不同的出生年代也就意味着人员年龄的差异,但在划分这一变量的时候,由于每个年代意味着最多的10年的年龄差别,这一年龄跨度比较大,有可能会影响到分析结果。出生年代的取值有三个:五十年代、六十年代和七十年代。企业性质(X3)该指标刻画了学员所在企业的性质是民企、国企还是外企。不同的企业在招人的时候对人员的素质会有不同的要求,而且不同性质的企业有着不同的企业文化和工作风格,这些差异和学员的学习能力——课程成绩是否会有较大的关系,我们需要通过数据分析来确定。最高学历(X4)学员的最高学历的取值有四个,分别为大专、本科、硕士和硕士及以上。最高学历直接衡量了学员在参加非学位职业培训前的受教育程度,是和学员的学习能力关联性较大的一个因素,一般来说学员之前的最高学历越高受教育程度就越大,相应的学位知识的学习能力也就越强。但学校知识的学习能力越强是否就意味着职业培训中的平均成绩越高?毕竟学位学习和非学位学习的知识结构和学习风格会存在着一些较为明显的差异,但经过初步判断这一解释变量将是一个比较重要的影响变量。最高学历毕业年代(X5)最后一个指标是学员最高学历的毕业年代,这一指标也是从原始数据中的学员的毕业年月日转化而来的,在划分年代时也存在着和出生年代划分时同样的取值跨度较大的问题。这一指标的取值有三个:八十年代、九十年代和21世纪(一零年代)。描述分析在正式的模型分析之前,我们首先对因变量以及自变量作必要的描述分析。主要结果如表1所示。核心发现以及结论如下。关于性别,首先可以看到的是样本量。从表1中可以看到,男的样本是133个。女的样本是45个。男的样本是明显多。以中位数计,男的成绩为exp(4.35)=11.8233分,女的成绩为exp(4.41)=11.98638分。相对差异不大。关于企业性质,首先可以看到样本分布不良。分别为95(国企)、43(民企)和40(外企)。相较而言,国企的比例稍高于民企和外企。以中位数计,国企的成绩为exp(4.38)=11.90484分,民企的成绩为exp(4.38)=11.90484分,外课程名称:实用商务数据分析与预测小组成员:陈玉洁、武晓威、李茗芝、李贞玟、霍华蕾指导老师:王汉生4企的成绩为exp(4.37)=11.87766分。国企和民企的成绩完全相同,而外企的成绩稍微低。关于最高学历,我们可以发现样本分布非常不均匀。分别为148(本科)、25(大专)、2(硕士)、3(硕士或以上)。本科成绩的均价为exp(4.39)=11.93202分,大专成绩的均价为exp(4.31)=11.71458,硕士成绩的均价为exp(4.42)=12.01356,硕士或以上成绩的均价为exp(4.36)=11.85048。可见,硕士成绩的均值比其他稍微高。表1:因变量(对数均价)的描述分析因素名称水平样本量均值标准差最大值中位数最小值性别男1334.3680.0954.4894.3943.912女454.3950.0754.5114.4074.174企业性质国企954.3780.0914.4894.3943.912民企434.3750.0964.4894.3944.094外企404.3650.0864.5114.3824.094最高学历本科1484.3860.0864.5114.4073.912大专254.3070.0984.4774.3174.094硕士24.41904.4194.4194.419硕士或以上34.3560.0264.3824.3574.331关于出生年代,首先需要说明的是,对于出生年代和最高学历毕业年代,我们都是在原始数据——即学员的具体出生年月日和最高学历毕业年月日的基础上经过初步的数据处理,按照每十年一个年代的常规分类方法把具体的年月日转化为了有一定时间跨度的年代,这种分类有利于我们对较为散乱的年月日进行分类,方便统计分析,找出定性数据的共性。出生年代的具体分类方法是:1950-1959年划分为五十年代;1960-1969划分为六十年代;1970-1979划分为七十年代。最高学历毕业年代划分方法:1980-1989为八十年代,1990-1999为九十年代;2000-2009为21世纪(一零年代)。表2: