数据行业终极职业指南 2 数据行业终极职业指南章节列表1.简介2.职业选择:数据分析师、数据科学家和数据工程师3.稀缺技能:21世纪最性感的工作4.工作:数据分析师薪资是多少?工作机会散布在哪里?5.角色和技能:你需要掌握哪些技能才能找到工作6.软技能:成功必备品质7.面试:成功攻略8.作品集:找到工作的秘密武器9.首个数据工作:什么样的工作,如何找到这样的工作10.数据的未来:预测分析简介11.总结 数据行业终极职业指南 3 IntroductionIntroduction在选择职业道路时,你可以追求平稳,也可以选择冒险。数据职业同时提供了这两种选择。一方面,它是一个安全的选择——对数据人才的需求在继续增加,并没有缩减的迹象。当你掌握数据技能后,几乎在任何行业都会成为炙手可热的人才。另一方面,外面是个全新的世界,我们产生了庞大的数据,数据让很多精彩的新事物成为可能。但是,为了利用所有这些数据,我们需要借助目前所掌握的方法和策略来发明新的方法,意味着未来会实时发生变革。站在数据行业前沿的人也是站在技术发展前沿的人。好消息是,无论你选择哪条道路——安全的道路、危险的道路,还是二者兼之,都会有无数的工作机会来满足任何对数据感兴趣的人士的需求。但是,如何实际行动起来呢?这份指南就可以派上用场。在Udacity,我们非常有幸能与世界上最具前瞻性的公司合作,并能够接触到数据领域最具创新思维的人士。我们的招聘合作伙伴,如Facebook,Google,Tableau,mongoDB等,提供这一领域最吸引人的职位机会,并且是了解企业对数据人才有何期望的重要信息来源。我们汇总了所有资料,并整理出了这份指南,我们的专业课程导师提供了独特的见解和经验。如果你想进入数据领域,那么这份指南最合适不过了。 数据行业终极职业指南 4 CareerOptions:Analysts,Scientists,andEngineers 数据行业终极职业指南 5 每当你发短信、发推文、在Facebook上晒照片、点击链接或在线购买商品时,都会生成数据。想一想,世界上有超过35亿的互联网用户和20亿的手机用户,这该会产生多少数据啊。幸运的是,数据成倍增加后,人们收集、组织和分析数据的能力也提高了。数据存储比以往成本更低,数据处理能力比以往更强大,各种工具更容易接触,使我们能够从大量数据中挖掘信息并为企业提供市场情报。在最近几年,数据分析的应用越来越广泛,从股价预测到预防家庭火灾,不一而足。所有这些数据分析都需要大量数据人才。引申含义是:现在是进入数据领域的最佳时机。在2011年,麦肯锡全球研究所指出所有这些数据分析都需要大量数据人才。引申含义:现在是进入数据领域的最佳时机。在2011年,麦肯锡全球研究所预测到2018年,美国可能会缺少150万了解如何利用数据分析做出有效决策的人才。实际上现在马上将要超过这一数字。CrowdFlower最近公布的一项数据科学报告指出,“在接受问卷调查的数据科学家人群当中,有83%的人士认为现今的数据科学家处于短缺状态”,这一结果很让人震惊。赶快把握机会吧。已经踏出成为专业数据人士的第一步?考虑下以下三大职业选择吧:数据分析师、数据科学家和数据工程师。数据分析师数据分析师本质上是初级数据科学家。如果你刚开始接触数据这一行业,并急于尝试进入这一领域,那么数据分析师是最佳起点。数据分析师不需要具有数学或研究背景以便开发新的算法,但是他们能够熟练地使用现有的工具来解决问题。技能和工具数据分析师需要对以下五大核心技能有基本掌握:编程、统计学、机器学习、数据再加工和数据可视化。要想成为一名成功的数据分析师,除了技术技能之外,还需要注重细节,能够有效地呈现结果。工作和职责数据分析师会受到企业内经验更丰富的数据专业人士的指导。在他们的指导下,数据分析师需要获取、处理和总结数据。数据分析师要保证数据收集的质量,按照相关人士的要求定期查询五大数据库,处理数据问题以便及时得出解决方案。他们还会以文字或图表的形式呈现易于看懂的结论。 数据行业终极职业指南 6 对于所有数据专业人士来说,无论职位级别高低如何,对数据始终保持好奇心、密切检查不断演变的最佳做法和工具都至关重要。数据科学家有些公司将“数据科学家”和“数据分析师”看做同等职位,但是二者之间在技能和经验方面存在一定的差别。虽然数据科学家和数据分析师在公司具有相同的使命——从庞大的数据池中得出结论,但是数据科学家的工作需要更复杂的技能,以便处理量更大、变换速度更快的数据。因此,数据科学家能够在没有指导的情况下开展调查研究,并处理开放性问题。数据科学家通常在量化领域具有很高的学历,例如计算机科学、物理学、统计学或应用数学,并且能够开发新的算法来解决数据问题。数据科学家在公司内的作用非常大,因为他们能够发现新的业务机会或通过发现隐藏的数据模式(例如发现令人惊喜的客户行为或发现潜在的存储集群故障),为企业节省开支。技能和工具数据分析师可能研究的是仅从单一来源获得的数据,而数据科学家研究的是不同来源的数据。数据科学家会使用Hadoop(最常用的分布式文件系统处理框架)等工具,使用Python和R等编程语言,并将高级数学和统计学知识运用到工作中。不同的单位和项目对技能的要求有所不同,下面的DataScienceLondon示例展示了数据科学家工具包的复杂程度: 数据行业终极职业指南 7 来源:DataScienceLondon数据科学家具备的最有价值的非技术技能是强烈的好奇心。数据科学家应该积极提出问题并寻求解决方案,从而挖掘出可能会让企业发生变革的宝贵信息。工作和职责数据科学家本质上就是利用数据来解决企业问题。他们分析数据、做出推断并获得解决方案,从而提出可以行动的建议。数据分析师是对过去的数据进行总结,而数据科学家是对未来做出决策。数据科学家可以明确地判断如何优化网站,以便更好地留住客户,如何宣传产品,实现更强大的客户生命周期价值,或者如何细调交付流程,以便加快速度和尽量减少浪费。 数据行业终极职业指南 8 数据工程师数据工程师负责构建稳健、容错的数据渠道,并将杂乱无序的数据清理、转换和汇总成数据库或数据源。数据工程师通常都是软件工程师。数据工程师的职责不再是数据分析,而是负责编译和安装数据库系统、编写复杂的查询、扩展到多个机器上,并部署灾难恢复系统。数据工程师本质上是为数据分析师或数据科学家打好基础,使他们能够轻松地检索所需的数据,并进行评估和实验。技能和工具数据科学家会从数据中发现规律,而数据工程师负责确保数据能从源头流畅地抵达目的地,以便处理数据。因此,数据工程师需要熟练掌握以下知识和技能:●基于Hadoop的技术,例如MapReduce、Hive和Pig●基于SQL的技术,例如PostgreSQL和MySQL●NoSQL技术,例如Cassandra和MongoDB●数据仓库解决方案工作和职责数据工程师负责幕后工作,使数据分析师和数据科学家能够更高效地完成他们的工作。底线对于数据行业来说,你有很多选择。如果你想要探索这一领域,则可以考虑以下三大主要选择:数据分析师、数据科学家和数据工程师。作为大数据分析和可视化初创企业DatavoreLabs的联合创始人,SanjayVenkateswarulu对这些分支领域的发展历史做出了以下比喻:“数据分析师逐渐演变成了这三大学科或更专业的学科。我认为随着现代医学的诞生,医生也经历了相同的专业化发展历程。一开始是村长或长者扮演着主要角色,但是随着工具越来越细化,现在出现了普通医师、外科医生和神经外科医生。” 数据行业终极职业指南 9 如果你刚开始接触数据科学这一领域,建议你先瞄准分析师岗位,用Venkateswarulu的比喻就是“普通医师”。当你积攒了各种技能和经验后,你将能够成长为数据科学家或数据工程师。 数据行业终极职业指南