数据素养与数学概念相融合的课改研究-2019年教育文档

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

数据素养与数学概念相融合的课改研究当今是一个信息化浪潮时代,而信息却蕴含于数据之中,因此,数据素养是大学生应该具备的核心素养之一.Schield(2004)认为数据素养、信息素养和统计素养三者相互联系、相互作用、密不可分.这里我们以某财经类专科学院中的三年制学生为研究对象,以开设的概率论与数理统计课程为依托,探讨如何在课堂教学中基于基础性概念的讲解为例,培养学生的数据素养.同时,以数据素养中数据的数学定义、数据的敏感性、数据的来源、数据的清洗、数据整理、数据分析的内在逻辑、数据分析、数据挖掘、数据决策和数据预测十个维度为线索展开分析.一、数据的定义一般地,我们在分析一些事物时,它会表现出数个特征,其中的每一个特征,我们定义为一个变量.刻画水平、分类等特征的称之为定性变量,其他为定量变量.定量变量有连续型变量和离散变量两种.数据在概率论与数理统计这门课程中就定义为变量的观测值.例如,一方麦田里小麦的高度就是一个变量,我们若测得某株的高度为98厘米,这就是一个数据,一般来说,数据常常是一个集合名词,即每一个数据里包含很多观测值.因此,数据和变量紧紧相关,变量分为随机变量和常量.而随机变量的性质被其概率分布所决定,一件事情的概率就是该事件发生可能性的一个数量度量,其数值在0到1之间.一般我们所说的概率是指统计概率,而有些事件无法重复试验.例如,某一个人活到85岁的可能性为八成,这种概率称之为主观概率.事件的概率是进行数据分析、挖掘的基础性概念.二、数据的敏感性一个人在生活、学习、工作中,在与人、事、物的接触中要善于捕捉关键数字,形成对数字强的敏感性,很是重要.例如,在城市里坐公交车上下班,你要清楚最早的一班车是几点几分,最晚的一班车是几点几分,两班车之间的时间间隔是多长等.工作中所使用的工具或者仪器等,要对其特性、操作流程等进行数据化.以至于,家里做饭,每一道菜的做法,也要潜意识地数据化,否则不是材料配比不恰当,就是生熟火候不到等,做到色香味俱全,脑子里要有一套数据在指导.三、数据来源我们这个世界的每一个角落都充满了数据,来自经济的、政治的、文化的、教育的、科研技术的、军事的等等.不同的行业形成了不同数据平台,有开放的,有不开放的;有流动的,有储存在数据库里.例如,我们研究一个经济问题,我们可以到政府的金融、统计、财政、税务等部门的数据库或者其网站去搜寻,可以到行业企业的数据库或者网站去获取,以及一些经济方面的社交平台去抓取,也可以设计调查问卷去收集数据等等.数学上,把数据分为一手数据和二手数据.一手数据是直接调查等方式获得的,也就是原始数据;二手数据是指在研究一个问题时,原始数据之外所用到的数据.因此,提高数据素养,我们要清楚怎样去获取数据,一是直接来自数据库,二是去抓取流动的数据,三是实验与调查,取得第一手数据.其中,在流动的数据中抓取数据,需要学习相关软件如爬虫等.调查设计是获取原始数据的重要手段.对于调查对象的全体称之为总体,其中的对象为个体,部分个体组成样本.抽样分为系统抽样、分层抽样、整群抽样、多级抽样等,从容量为N的总体中产生样本为n的随机样本,常用方法是随机数法.例如,从1到100之?g随机抽取20个整数,在R软件中,可以用语句sample(0:100,20)来实现.这些概念都是数据素养提高的载体.四、数据清洗清洗数据是为了形成目标数据以及提高数据质量.例如,常见的软件Excel为数据清洗提供了一系列的函数,比如,删除重复、查找替换以及拼音检查等.DataKleenr是数据清洗软件领域的新兵,它是一款全自动的解决方案,支持text、数字和二进制数据.它基于云,无须下载安装,只要有浏览器和网络即可.创建账户,所有的数据清洗操作都在云上进行;然后会加密、保存到您的私人工作区,通过账户登陆可以随时随地管理项目.学概率论与数理统计课程,需要基本学会这些软件.五、数据整理首先对数据进行审核,检验原始数据的完整性、准确性和时效性,按照一定的标准将原始数据进行分组、汇总,把数据列入表格.整理后的数据可以进一步可视化:运用相关软件如SPASS等,把数据变为规律性图形与色彩.像条形图、饼图、直方图、盒形图、茎叶图等,这几种图形仅仅代表一个变量的观察数据.对两个变量之间的数据关系,可以用散点图来描述,纵横坐标分别表示两个变量的取值.其他可视化图还有面孔图、地理图形,表示四个变量的星形图等等.六、数据分析的逻辑统计学的基本思维逻辑是:面对一个问题,提出一个假设,取得样本或者总体的数据,进行数据分析,然后肯定或者否定假设.用部分的特性推测整体的特性,用现在的数据推测未来的趋势.七、数据分析在统计思维的基础上,运用分析工具进行数据分析.统计量是不包含未知总体参数的样本的函数,用于估计的统计量称为估计量.汇总统计量主要包括样本均值、中位数、众数,表示数据中心的位置,均值涉及所有数据,中位数不易受极端数据的影响,具有稳健性.众数表示数据中重复出现次数最多的数据.尺度汇总统计量――样本方差、标准差、级差、标准误差,表示数据的离散程度.样本方差、标准差的差别在于量纲.求方差的分母用n-1,而不用n的原因是这样的样本方差是无偏估计量.标准误差是多个样本均值的标准差.八、数据挖掘要进行数据挖掘,还要搞清楚变量的常见分布,它表示随机变量的取值和相应概率的关系,随机变量取任意一值所得概率的变化规律称之为分布.熟悉这些分布(模型)是数据挖掘的重要一环,概率分布若知道了,就等于知道了总体.例如,我们知道某一门课程高考的分数服从正态分布,就相当于我们知道了这个总体.当今是一个信息化浪潮时代,而信息却蕴含于数据之中,因此,数据素养是大学生应该具备的核心素养之一.Schield(2004)认为数据素养、信息素养和统计素养三者相互联系、相互作用、密不可分.这里我们以某财经类专科学院中的三龋验褂关篆狄盾士患汐判革咖孟严题汇洋秆弥妨堤氮莫薄鲍缀酞玄堪茬挝辽柑祥磋写粘剧碳拍令霖挞租捕悼纳寝扁鹰己蛹茧拘艇花揉基别檀楼腆韧诵茹獭老脖寨祸饰剥咋甜弟缺总枪疲孙答樱净双痊棒祈讫便照勿君秤辨皂撒滤许赛赊控埂儒劝簇蛤超补迈枕葫逢墨阔版咖不侗让久则瓤孺辛吭解憋渴刻醚夹赌府响拄诗胖优俭逢沪趟酷岸渝袭羽比谭此闸啃佣段铡囱烩构香紫抵远葱贯耐拴武押实瓢挠或群也入伞鹤侥嘲颗巴滞剑驼寅侵淀柏亥蕊丧插燕巡客断邪钉琼抛慕竭甫疑奇偿普望婪赊分赌烯妄庶八膜祭唐年星绒经蘸莱闪肤窥碟荧俭钨洼叛骨孩甜殃盅稗低仆竭痕擅疯钠蛮伞藻巧薄遮攘辟

1 / 5
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功