机器学习-01

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

机器学习讲师黄志洪DATAGURU专业数据分析社区机器学习第1课机器学习讲师黄志洪DATAGURU专业数据分析社区课程说明机器学习算法为主的课程,结合软件的使用和部分案例课程需要有一定的数学素养,数学是能表达量化关系和算法的唯一语言将机器学习算法用于大数据挖掘,是本课程的主要目标,但也会讲述其它的机器学习覆盖领域参考书大多艰涩,言简意赅,但通过精读即使能掌握部分也能有很大收获。希望学习者可以坚持怎样把复杂的算法用浅显易懂的方式和例子,向非专业人士清晰表达,是本课程的最大挑战课程内容可能会根据授课情况作出调整课程周期视内容难度每1-2周1次授课请大家重视交流,不要留下知识盲点机器学习讲师黄志洪DATAGURU专业数据分析社区在炼数成金课程线路图中的位置机器学习讲师黄志洪DATAGURU专业数据分析社区在炼数成金课程线路图中的位置机器学习讲师黄志洪DATAGURU专业数据分析社区课程目标熟悉课程里所介绍的各种算法的细节懂得如何使用这些算法去解决实际场景问题熟悉了解常用的机器学习和数据挖掘软件育成目标:数据分析师,算法设计师,具备算法设计能力的高层次程序员机器学习讲师黄志洪DATAGURU专业数据分析社区参考书机器学习讲师黄志洪DATAGURU专业数据分析社区参考书7机器学习讲师黄志洪DATAGURU专业数据分析社区参考书机器学习讲师黄志洪DATAGURU专业数据分析社区参考书机器学习讲师黄志洪DATAGURU专业数据分析社区参考书机器学习讲师黄志洪DATAGURU专业数据分析社区什么是机器学习机器学习是指是一门多领域交叉学科。专门研究计算机或其它软硬件设备怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。应用机器学习技术到产品中,给用户带来“机器具备人类般高智能”的震撼性体验。人力成本又越来越高,机器学习能降低企业成本,提高投入产出比。第二次机器革命——以具备人类智能为核心价值的机器占主导地位(第一次机器革命——动力系统革命),对国家软实力具有重要作用。机器学习是人工智能研究的核心内容。它的应用已遍及人工智能的各个分支,如专家系统、自动推理、自然语言理解、模式识别、计算机视觉、智能机器人等领域。机器学习在数据挖掘里被大量使用,其技术内涵几乎通用,可以看作同一座山峰在不同视角下的侧影。机器学习讲师黄志洪DATAGURU专业数据分析社区机器学习比较活跃的领域数据分析和数据挖掘:机器学习实现一套工具、方法或程式,从现实世界的海量数据里提炼出有价值的知识,规则和模式。并把该提炼成果应用到前台系统,辅助业务的进行,使其达到更好的效果,例如推荐,辅助决策(沙盘推演,博弈,预测结果),精准辨别,参与服务等,使到业务能产生更大的效益图像和语音识别:语音输入,OCR,手写输入,通讯监控,车牌识别,指纹识别,虹膜识别,脸像识别智慧机器,机器人:生产线机器人,人机对话,电脑博弈机器学习讲师黄志洪DATAGURU专业数据分析社区推荐系统当当网的图书推荐汽车之家的同类汽车推荐淘宝的同类商品推荐新浪的视频推荐百度知道的问题推荐社交推荐职位推荐机器学习讲师黄志洪DATAGURU专业数据分析社区推荐系统:京东商城机器学习讲师黄志洪DATAGURU专业数据分析社区百度知道机器学习讲师黄志洪DATAGURU专业数据分析社区百度知道机器学习讲师黄志洪DATAGURU专业数据分析社区贝叶斯分类:判定垃圾邮件机器学习讲师黄志洪DATAGURU专业数据分析社区垃圾邮件判断原理分词贝叶斯公式与贝叶斯分类器机器学习讲师黄志洪DATAGURU专业数据分析社区网页自动分类自动化门户系统(百度新闻,谷歌新闻等)搜索引擎根据用户标签类型推送不同类别的搜索结果机器学习讲师黄志洪DATAGURU专业数据分析社区评论自动分析机器学习讲师黄志洪DATAGURU专业数据分析社区决策树给出样本集,学习后输出的产物是一颗决策树机器学习讲师黄志洪DATAGURU专业数据分析社区智能博弈:中国象棋云构想局面标准化局面评估函数棋谱学习机器学习讲师黄志洪DATAGURU专业数据分析社区频繁模式挖掘机器学习讲师黄志洪DATAGURU专业数据分析社区语音识别语音输入规范化语音:嘀嘀打车语音属主鉴别机器学习讲师黄志洪DATAGURU专业数据分析社区图像识别指纹、虹膜纹识别脸像识别车牌识别动态图像识别小波分析机器学习讲师黄志洪DATAGURU专业数据分析社区软件RWekaMatlabPython参考:机器学习讲师黄志洪DATAGURU专业数据分析社区RR的源起R是S语言的一种实现。S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析、作图的解释型语言。最初S语言的实现版本主要是S-PLUS。S-PLUS是一个商业软件,它基于S语言,并由MathSoft公司的统计科学部进一步完善。后来Auckland大学的RobertGentleman和RossIhaka及其他志愿人员开发了一个R系统。R的使用与S-PLUS有很多类似之处,两个软件有一定的兼容性。27机器学习讲师黄志洪DATAGURU专业数据分析社区RRisfreeR是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输入,可实现分支、循环,用户可自定义功能。R是一个免费的自由软件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免费下载和使用的,在那儿可以下载到R的安装程序、各种外挂程序和文档。在R的安装程序中只包含了8个基础模块,其他外在模块可以通过CRAN获得。R官方网站地址:R的特点1.有效的数据处理和保存机制。2.拥有一整套数组和矩阵的操作运算符。3.一系列连贯而又完整的数据分析中间工具。4.图形统计可以对数据直接进行分析和显示,可用于多种图形设备。5.一种相当完善、简洁和高效的程序设计语言。它包括条件语句、循环语句、用户自定义的递归函数以及输入输出接口。6.R语言是彻底面向对象的统计编程语言。7.R语言和其它编程语言、数据库之间有很好的接口。8.R语言是自由软件,可以放心大胆地使用,但其功能却不比任何其它同类软件差。9.R语言具有丰富的网上资源29机器学习讲师黄志洪DATAGURU专业数据分析社区R商业版本的RRevolutionR(官网:),老板是spss的发明者很多大型厂商也在开始推出自己的R或兼容R的产品,例如Oracle、IBM、Sybase30机器学习讲师黄志洪DATAGURU专业数据分析社区R的CRANTaskView机器学习讲师黄志洪DATAGURU专业数据分析社区PythonGuidovanRossumzai1989年创立了PythonIwrotepython!Python语言的特点NumPySciPyMatplotlib机器学习讲师黄志洪DATAGURU专业数据分析社区MATLABMATLAB=matrix+laboratory,是由美国mathworks公司发布的主要面对科学计算、可视化以及交互式程序设计的高科技计算环境。MATLAB和Mathematica、Maple并称为三大数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。MATLAB可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。具有功能完备强大的神经网络包机器学习讲师黄志洪DATAGURU专业数据分析社区MATLAB机器学习讲师黄志洪DATAGURU专业数据分析社区WEKAWEKA=WaikatoEnvironmentforKnowledgeAnalysis免费的,非商业化的,基于JAVA环境下开源的机器学习以及数据挖掘软件。Weka的主要开发者来自新西兰的Waikato大学。官网:Petaho:机器学习讲师黄志洪DATAGURU专业数据分析社区具有代表性的算法回归预测及相应的降维技术:线性回归,Logistic回归,主成分分析,因子分析,岭回归,LASSO分类器:决策树,朴素贝叶斯,贝叶斯信念网络,支持向量机,提升分类器准确率的Adaboost和随机森林算法聚类与孤立点判别人工神经网络机器学习讲师黄志洪DATAGURU专业数据分析社区低成本获取高端知识技术成就梦想炼数成金edu.dataguru.cnDATAGURU专业数据分析网站FAQ时间

1 / 38
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功