校园霸凌事件的数据分析与校园霸凌

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

参赛队号#4946第九届“认证杯”数学中国数学建模网络挑战赛承诺书我们仔细阅读了第九届“认证杯”数学中国数学建模网络挑战赛的竞赛规则。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们接受相应处理结果。我们允许数学中国网站()公布论文,以供网友之间学习交流,数学中国网站以非商业目的的论文交流不需要提前取得我们的同意。我们的参赛队号为:4946参赛队员(签名):队员1:杨倩队员2:付润丰队员3:雷丹妮参赛队教练员(签名):刘晓俊参赛队伍组别(例如本科组):本科组参赛队号#4946第九届“认证杯”数学中国数学建模网络挑战赛编号专用页参赛队伍的参赛队号:4946竞赛统一编号(由竞赛组委会送至评委团前编号):竞赛评阅编号(由竞赛评委团评阅前进行编号):参赛队号#4946校园霸凌事件的数据分析与校园霸凌行为的解决方法摘要校园霸凌事件是一个重大的社会问题,引起了政府部门和社会各界的高度重视。本文意图通过对不同年龄段在校生的心理状态进行量化统计,用数学模型的方式找出校园霸凌事件的产生原因,并提供解决方案。针对第一问,由于不同年龄段学生心理状况的差异,因此学生在生命教育、生活方式、娱乐等领域有不同看法,本文构造正向和负向两个框架。对统计得来的数据进行显著性比较,将不同组段的人群进行两两比对。使用spss软件对每组进行t检验,比对sig值,当p0.05时说明差异性不显著,0.01p0.05表示差异性显著,p0.01表示差异性极显著。通过寻找各组之间的显著性差异指标,找到不同组段人群在不同领域上的认知差异,进而对校园霸凌事件的产生原因得出初步结论。针对第二问,校园霸凌事件的发生主要由不同年龄段学生的认知差异造成,而认知差异又与人格导向有关。以9岁组为例,生命正向作为因变量,对于自变量(风险偏好、认知需要、决策风格)依靠spss软件进行多元线性回归预测和二元logistic回归分析,建立线性回归模型,并找到其它几个因变量的主要影响因素,总结出自变量与因变量之间存在关系,并筛选出最主要的自变量(即对因变量影响最大的因素)。寻找主要影响性格的因素,并提供防止校园霸凌事件发生的方法。关键词:校园霸凌显著性检验多元线性回归预测二元logistic回归分析参赛队号#49461一、问题重述近年来,我国发生的多起校园霸凌事件在媒体的报道下引发了许多国人的关注。霸凌事件对学生身体和精神上的影响是极为严重而长远的,因此对于这些情况我们应该给予高度的重视。霸凌是各种形式校园暴力中的一种,从某种意义上说,也是危害程度较高的一种。不同于偶发的暴力事件,霸凌行为通常伴随着肉体与精神的双重伤害,并且这种伤害通常会持续很长时间,有时可能会对受害者的心灵产生终身创伤。如果没有受到专业的心理引导,受害者有可能转变为报复社会的人,进而从受害者转变为施暴者,将自己的遭遇原封不动或放大百倍地转嫁到他人身上。[1]本文通过对问卷调查结果的数据处理,建立一个有关青少年存在潜在心理问题的可能性的模型。运用五个年龄段在生命教育、生活方式、娱乐领域的影响因素(风险偏好、认知需要、决策风格)的分析,来解决以下问题:(1)统计分析调查所得数据,判断各个年龄段的心理状况是否有显著的差异。(2)建立合理的数学模型,分析不同框架的主要影响因素。二、问题分析本文目标主要是通过根据调查数据建立数学模型。针对问题一:对调查结果中不同年龄段的学生的群体心理状况进行两两对比。比较其在生命教育、生活方式、娱乐等领域的不同看法,并进行显著性比较,使用spss软件对每组进行t检验,比对sig值,当p0.05时说明差异性不显著,0.01p0.05表示差异性显著,p0.01表示差异性极显著。针对问题二:对调查结果中影响因变量框架(生命教育、生活方式、娱乐等领域)的因素使用spss软件进行多元线性回归预测和二元logistics回归分析,分析变量之间是否存在关系,筛选突出的自变量,并且加以分析,总结出对于校园霸凌事件发生的主要策略[2]。五个年龄段青少年的心理状况影响生命教育(正向、负向)生活方式(正向、负向)娱乐(正向、负向)影响风险偏好认知需要决策风格18道题目理智型(5题)直觉型(5题)依赖型(5题)回避型(5题)冲突型(5题)对题目中的各条件关系进行如下整理得到得到参赛队号#49462三、模型假设1、假设只有生命教育、生活方式、娱乐这三项领域影响了青少年们的心理状况;2、假设条件中18道题目的得分绝对决定了自变量认知需要的得分;3、假设条件中影响自变量决策风格的五个维度绝对由其5个题目得分所决定;4、假设模型求解中所运用的数据都是合理的,不存在极端现象。四、符号说明符号说明𝑷𝒏Sig值𝒀𝒊因变量𝑿𝒊自变量𝜷̂总体回归系数𝑃𝑛的最有优线性无偏计量𝛃总体回归系数五、模型的建立与求解5.1问题一的模型建立和求解对于数据的处理,首先利用excel将调查结果中的文本A、B转化为+1和-1,方便于spss对数据进行分组统计比较。并筛选出年龄组中与该年龄段相符的数据,将其导入spss中,利用T检验得出sig值。下图为第一组sig值的计算结果P1、P2、P3、P4、P5、P6(1)9岁组与11岁组的数据比较参赛队号#49463图表1-1结果显示9岁组和11岁组的比较中,生命正向、娱乐正向的显著性0.01P10.05、0.01P50.05得出差异性显著;生命负向、生活负向、娱乐负向的显著性P20.01、P40.01、P60.01,得出差异性极显著,生活正向的显著性P30.05,结果不显著。由以上数据可以得出初步结论,在9岁与11岁组段的比较中,生命负向、生活负向、娱乐负向的心理状况差异极显著;生命正向、娱乐正向的显著性差异显著。(2)11岁组与13岁组的数据比较图表1-2结果在11岁组和13岁组的比较中,只有生活负向的sig值P40.01,显示差异性极显著,而其它的P1、P2、P3、P5、P6结果均显示P0.05。差异性不显著。由以上数据得出初步结论,在11岁组和13岁组的比较中,生活负向的心理状态差异性显著,而其它的几项指标差异性均不显著。参赛队号#49464(3)13岁组与15岁组的数据比较图表1-3在13岁和15岁组的比较中,所有指标的sig值P0.05,结果显示在此组段中的学生群体在以上六个指标的差异性均不显著。(4)15岁租与17岁组的数据比较图表1-4在15岁和17岁组的比较中,生命正向、生命负向的sig值P1、P2显示P0.01,结果为差异极显著;生活正向、生活负向的sig值P3、P4显示0.01P0.05,结果为差异显著;娱乐正向、娱乐负向sig值显示P0.05,结果为差异不显著。(5)17岁组与9岁组的数据比较图表1-5在跨度较大的年龄组17岁组和19岁组的比较中,生命正向、生命负向、生活负向、参赛队号#49465娱乐正向、娱乐负向的sig值P1、P2、P4、P5、P6值均显示P0.01,差异极显著;生活正向的sig值0.01P30.05。结果显示差异性显著。综上所述在9岁组和11岁组的比较中,以上6个指标中有5个显示差异显著,其中有三个指标显示极显著,因此得出结论在9岁到11岁的年龄段学生的心理状态特点为分歧较多。在11岁组和13岁组的比较中,以上6个指标只有生命负向结果显示为差异极显著,其它5个指标显示差异不显著。表明该组段的学生群体心理状态较为接近。在13岁和15岁的比较中,所有指标差异均不显著,表明该组段的学生群体心理状态较为接近。在15岁和17岁组的比较中,以上6个指标有4个指标显示为差异显著,其中生命正向和生命负向显示为差异极显著。表明该组段的学生群体心理状态分歧较多。在跨度较大的9岁和17岁的学生群体比较中,所有6个指标均显示差异显著,其中有5个指标显示差异极显著。表明9岁和17岁组段的学生心理状态分歧极多。根据以上分析,可以由此推测,校园霸凌事件发生较为集中的年龄段应该为9岁到11岁以及15岁到17岁,此年龄段的学生群体心理状态变化较为明显。此外,年龄差距越大,学生心理状态差异性越明显,当年龄分布在以上两个心理状态变化较大的年龄段两侧,心理状态差异性尤其明显。5.2对于问题二的模型建立以及求解(1)模型的建立和解决图表2-1基于对数据的分析,利用spss建立线性回归模型。得到图表2-3,结果显示0R0.4,生命正向与各自变量之间具有一定的线性相关关系。在通过各种检验的基础上,多元线性回归模型可以用于预测。多元线性回归预测与一元线性回归的预测原理是一致的,其基本公式如下:01122...+iiikkiiYXXX……多元线性回归预测公式其中,(j=2,3,…,k)为给定的在预测期的具体数值;为已估计出的样本回归系数;为给定时Y的预测值[3]。参赛队号#49466设自变量为风险偏好,为直觉型,为依赖型,理智型,为回避型,为冲动型,为认知需要;因变量Y为生命正向。那么我们的模型即为求Y的模型:其中:10111221112011222222011221111221(1)011...+...+...+1...1................1......kkkknnnkknnkknknnkkknYXXXYXXXYXXXXXXXXXX...令011...kn……矩阵公式由于自变量X的设定值同其真值不一致所造成的误差。样本回归系数是根据样本估计的,它与总体回归系数之间总是有一定的误差。当给出的在样本之外时,其本身也需要利用某种方法去进行预测。如果与未来时期X的实际值不符时,求得Y的预测值当然也会与实际值不符。因此会造成误差。具体公式如下[4]:参赛队号#494672211i121ˆminˆ=0ˆ=min()nniiittniiitiiniiiyyeeyyieabxssyabx其中表示第个观察值下的残差值,且设y代入最小误差平方和公式…最小误差平方和公式利用spss进行多元线性回归预测,得到相关的数据和图形。可以直观地看出数据点分布在回归直线附近。所以得出因变量(生命正向)与自变量之间存在线性相关关系。图表2-2参赛队号#49468图表2-3由图表2-4、图表2-5,可知在误差极小的情况下,显著性p值0.05,并且数据拟合程度较高,可得出七种自变量与因变量(生命正向)之间相关。依据以上数据处理和分析原理可得生命正向、生命负向、生活正向、生活负向、娱乐正向、娱乐负向六个因变量都与上述七种自变量相关。(2)对数据的进一步分析我们就调查数据所得出的结果进行分析和统计,选定因变量(生命教育、生活方式、娱乐三个领域)和自变量(包括风险偏好、认知需要、决策风格),使用spss对数据进行logistic回归分析。部分过程如下。对因变量影响因素的讨论,这里列出9岁组的分析数据,详见附录一:参赛队号#49469图表2-4在9岁组中,以生命正向为因变量,以风险偏好、认知需要、理智型、直觉型、依赖型、回避型、冲动型为自变量进行logistic回归分析,结果显示在9岁组中风险偏好、直觉型、冲动型对生命正向的影响显著性sig值P0.05,表明风险偏好、直觉型、和冲动型是影响生命正向的主要因素。图表2-5以生命负向为因变量,以风险偏好、认知需要、理智型、直觉型、依赖型、回避型、冲动型为自变量进行logistic回归分析,结果显示在9岁组中风险偏好、直觉型对生命负向的影响显

1 / 31
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功