大数据通用处理平台1.Spark2.Flink3.Hadoop分布式存储HDFS资源调度YarnMesos机器学习工具Mahout1.SparkMlib2.TensorFlow(Google系)3.AmazonMachineLearning4.DMTK(微软分布式机器学习工具)数据分析/数据仓库(SQL类)1.Pig2.Hive3.kylin4.SparkSQL,5.SparkDataFrame6.Impala7.Phoenix8.ELK8.1ElasticSearch8.2Logstash8.3Kibana消息队列1.Kafka(纯日志类,大吞吐量)2.RocketMQ3.ZeroMQ4.ActiveMQ5.RabbitMQ流式计算1.Storm/JStorm2.SparkStreaming3.Flink日志收集ScribeFlume编程语言1.Java2.Python3.R4.Ruby5.Scala数据分析挖掘MATLABSPSSSAS数据可视化1.R2.D3.js3.ECharts4.Excle5.Python机器学习机器学习基础1.聚类2.时间序列3.推荐系统4.回归分析5.文本挖掘6.决策树7.支持向量机8.贝叶斯分类9.神经网络机器学习工具1.Mahout2.SparkMlib3.TensorFlow(Google系)4.AmazonMachineLearning5.DMTK(微软分布式机器学习工具)算法一致性1.paxos2.raft3.gossip数据结构1.栈,队列,链表2.散列表3.二叉树,红黑树,B树4.图常用算法1.排序插入排序桶排序堆排序2.快速排序3,最大子数组4.最长公共子序列5.最小生成树最短路径6.矩阵的存储和运算云计算云服务1.SaaS2.PaaS3.IaaS4.Openstack5.DockerEnd.