西南财经大学天府学院大数据时代的信息分析实训报告学生姓名:31300427商靖诚31300510张越越31300426何通31300626顾苓琰31300441刘鹏所在班级:2013级103班摘要对于数据分析,这无疑是一个前所未有的黄金时代。现在,几乎每个人的衣袋都有一部可以随时联网的智能手机,更强大的平板电脑则安静的躺在数亿人的手提包里,加之久久没有退出历史舞台的个人电脑和方兴未艾的物联网中的电子设备,这个世界,每时每刻有数以百亿计的电子精灵在产生数据,一个崭新的数据爆炸时代正喷薄而出。本文以大数据和大数据分析来写,从了解大数据的概念、大数据与传统数据库应用的比较,大数据与大数据分析的概念来了解什么是大数据,通过实训模拟来进一步描述我们所了解的大数据,从我们的实训模拟中来得出的大数据来知道现在这个信息发达的时代什么是需要的、什么是我们可以通过数据去完成的。然后在文中也写到了大数据的两面性,我们要合理利用大数据。关键词:大数据数据爆炸数据分析AbstractFordataanalysis,thisisahithertounknownofthegoldenage.Now,almosteveryonehasamobilephonepocketintelligentcanbenetworked,flatcomputermorepowerfulquietlylyinginthehundredsofmillionsofpeople'shandbag,andforalongtimewithoutelectronicequipment,quitthestageofhistoryofthepersonalcomputerandtheInternetofthingsbejustunfoldingintheworld,allelectronicelvestensofbillionsofinthedata,aneweraofinformationexplosionisgushingout.Basedontheanalysisoflargedataanddatatobewrittento,fromconcept,largedataoflargedataandtraditionaldatabaseapplications,conceptanalysisdataanddatatounderstandwhatisthebigdata,largedatafurtherdescribedbytrainingsimulation,weknow,bigdatafromourtrainingsimulationatfromnowtoknowthisinformationdevelopederaofwhatisneeded,whatwecanthroughthedatatocompletethe.Thenwrotetwosidesoflargedatainthispaper,weshouldmakeuseofthelargedata.Keywords:BigdataThedataexplosion目录摘要.........................................................................................1Abstract....................................................................................3正文...............................................................错误!未定义书签。引言...............................................................错误!未定义书签。一、大数据.....................................................错误!未定义书签。(一)什么是大数据........................................错误!未定义书签。(二)大数据与大数据分析..............................错误!未定义书签。二、实训模拟..................................................错误!未定义书签。(一)实训模拟过程描述.................................错误!未定义书签。(二)实训模拟心得体会.................................错误!未定义书签。(三)实训模拟结语........................................错误!未定义书签。三、总结.........................................................错误!未定义书签。四、文献.........................................................错误!未定义书签。引言20年前,“数据”对于普通人来说,还是一个相当专业的词汇。时至今日,“数据”已经无孔不入地渗透到我们的生活。人们在日常生活和工作中收发邮件和短信、拍照、录像、撰写文稿、计算机绘图及编程,每天都在源源不断地产生大量的数据。全人类一年产生的数据量以及它的增长速度都大得惊人:全球著名咨询机构IDC(国际文献资料中心)在2006年估计全世界产生数据量为0.18ZB(1ZB=100万PB),而截至2011年这个数字已经提升了一个数量级,达到1.8ZB,相当于全世界每个人一块用100多GB的硬盘存储的数据。这种增长仍在加速,预计2015年将达到近8ZB。2011年6月,麦肯锡全球研究所(MGI)发布了《大数据:创新、竞争和生产力的下一个前沿》(Bigdata:Thenextfrontierforinnovation,competition,andproductivity)。在这份报告中,“大数据”的概念得到了清晰阐释,麦肯锡在研究报告中指出,数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素;而人们对于海量数据的运用将预示着新一波生产率增长和消费者盈余浪潮的到来。2012年1月在瑞士举行的达沃斯世界经济论坛发布了一份名为《大数据,大影响》(BigData,BigImpact)的报告,再次引起全球关注与热议。这份报告认为,大数据就像货币和黄金一样,是一种新型的经济资产。多家投资机构甚至据此判断,“大数据”将会成为贯穿2012年的一条全新投资主线。哈佛大学定量社会研究所主任加里·金(GaryKing)在接受《纽约时报》记者史蒂夫采访时说:“这是一场革命,我们现在做的只是冰山一角,但是由于庞大的数据新来源而带来的定量化方法,将横扫学界、商界和政界,所有领域都将被触及。”2012年3月29日,美国联邦政府宣布了《大数据研究和发展倡议》(BigDataResearchandDevelopmentInitiative),斥资2亿美元投入大数据研究领域,以加强政府各个部门、研究机构和其他组织从大量复杂的数据中提取、分析重要信息的能力。这一倡议涉及美国联邦政府的六个部门,分别是美国国家科学基金、美国国家卫生研究院、美国能源部、美国国防部、美国国防部高级研究计划局和美国地质勘探局。这些部门将大力推动和改善与大数据相关的收集、组织和分析工具及技术的研发和使用,力图在科学发现、环境保护和生物医药研究、教育、国家安全及战争策略等领域利用大数据能力取得突破。中国已经成为世界第二大经济体,但不容忽视的是高增长的代价十分高昂,从总体上来看,中国仍处于全球经济食物链的底端,用高能耗、高污染、廉价劳动力维系经济增长的模式难以为继,中国在蒸汽机革命和电气化革命中都落后于世界,但在“大数据时代”不能再落后。我们拥有前所未有的历史机遇:中国不仅拥有世界上最多的人口,到2005年底,中国的高等学校有2300余所,在学大学生总数已超过2300万人,高等教育总体规模已位居世界第一位。中国的大学培养了大量的IT、数据统计、社会管理等专业人才,为中国的大数据战略进行了很好的人才储备。能否在“大数据”时代抓住历史机遇,成为全球信息革命的主角,是实现中国经济结构转型和中华民族伟大复兴的重要一、大数据(一)、什么是大数据有人把数据比喻为蕴藏能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似,大数据并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。对于很多行业而言,如何利用这些大规模数据是成为赢得竞争的关键。大数据的价值体现在以下几个方面:1)对大量消费者提供产品或服务的企业可以利用大数据进行精准营销;2)做小而美模式的中长尾企业可以利用大数据做服务转型;3)面临互联网压力之下必须转型的传统企业需要与时俱进充分利用大数据的价值。不过,“大数据”在经济发展中的巨大意义并不代表其能取代一切对于社会问题的理性思考,科学发展的逻辑不能被湮没在海量数据中。著名经济学家路德维希·冯·米塞斯曾提醒过:“就今日言,有很多人忙碌于资料之无益累积,以致对问题之说明与解决,丧失了其对特殊的经济意义的了解。”这确实是需要警惕的。(二)大数据与大数据分析大数据分析是指对规模巨大的数据进行分析。大数据可以概括为4个V,数据量大(Volume)、速度快(Velocity)、类型多(Variety)、真实性(Veracity)。大数据作为时下最火热的IT行业的词汇,随之而来的数据仓库、数据安全、数据分析、数据挖掘等等围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。随着大数据时代的来临,大数据分析也应运而生。二、实训模拟(一)实训模拟过程描述下图为对各家公司02年-15年的利润总额合计,从下图可知工商银行的净利润最高。其在2014年净利润达到巅峰,从02-15年,呈现递增形式。(商靖诚作业)下图为各个行业02-15年近利润。从下图可知银行业的净利润为最高,达到了1448297161,我们构画了饼状图帮助大家分析。从饼状图上可以明显看出,在02年第三季度百货零售业的净利润达到了486.04%,而在05年银行的净利润远超其他行业,高达92.24%,一直到14年,银行业的净利润有上升到了94.53%。(商靖诚作业)公司年-季度利润总额从下图可以看到各个公司在每年的每个季度的利润总额,其中占据龙头地位的分别是工商银行建设银行中国银行农业银行,以及一系列小银行。这几家公司的利润总额分别是530865000442163600347665600273342500.当之无愧的龙头。(张越越作业)那么我们再来看各个行业的利润总额,问问占据龙头地位的依然是银行业,高达65.46%,而紧随其后的第二名是酒饮料行业,虽然是第二名,但是只占据15.12%。而图中能看到了最少的是卷商,1.21%。借助饼状图可以明显看出。(张越越作业)我们继续看各个公司的营业利润,营业外收入,营业总收入,和营业收入。从此可以看出各个行业的收入主体所占的比重。从下图中可以明显看出,营业利润最高的依然是几家银行,而保利地产和五粮液也可以占据排前的位置。不过营业总收入最高的却还是银行。(刘鹏作业)接下来个各个行业的营业外收入营业收入和营业总收入的比较,排名第一的还是银行,3782533785.第二名为酒饮料业,117975787.第三名是IT行业,176102009。第四名是地产商151848760.(刘鹏作业)前文分别分析了各个公司和行业的净利润利润总额营业收入,接下来我们看看各行各业各家公司的负债情况,可以让我们更加清晰的看出他们的风险。非流动资产合计中,最高的是保利地产,148925917,其次是招商地产,39164052,随后是北京城建16372285.可见地产行业的非流动资产较