数据分析师入门与精通 较近小编浏览各大博客论坛发现,很多人想学习数据分析师,想从小白变成高手,由此,小编就整理了一些文档,告诉你大数据领域需要哪些技能? 一、大数据*知识及hadoop入门 零基础入门,了解大数据的历史背景及发展方向,掌握hadoop的两种安装配置 二、Hadoop部署进阶 熟练掌握hadoop集群搭建;对Hadoop架构的分布式文件系统HDFS进行深入分析 三、Java基础 了解java程序设计的基本思想,熟练利用eclipse进行简单的java程序设计,熟练使用jar文件,了解mysql等数据库管理系统的原理,了解基于web的程序开发流程 四、MapReduce理论及实战 熟悉MapReduce的工作原理及应用,熟悉基本的MapReduce程序设计,掌握根据大数据分析的目标设计和编写基于mapreduce的项目 五、hadoop+Mahout大数据分析 掌握基于hadoop+mahout的大数据分析方法的使用场景,熟练运用mahout的成熟算法进行特定场景的大数据分析 六、Hbase理论及实战 掌握hbase的数据存储及项目实战、掌握Spark、Hive的安装、配置及使用场景 七、Spark大数据分析 Spark、Hive的安装、配置及使用场景,熟练运用Spark的成熟算法进行特定场景的大数据分析 八、大数据学习综合知识储备 统计学:多元统计分析、应用回归 计算机:R、python、SQL、数据分析、机器学习 matlab和mathematica两个软件也是需要掌握的,前者在实际的工程应用和模拟分析上有很大优势,后者则在计算功能和数学模型分析上十分优秀,相互补助可以取长补短。 2、书籍推荐 《R语言实战》:RinAction 卡巴科弗教授撰写,R语言界公认的圣经,因为中文翻译蛮通俗,在讲案例的时候还会重复延伸到基础知识,死磕起来也不会太费劲,能让人以较快的速度进入R语言的世界。 《深入浅出数据分析》:Head First Data Analysis 对就是这本名声在外、像砖头一样的书,但他字大行稀,而且插图满天飞,较重要的是讲的真的**简单,根本不用担心看不懂,入门*。要是觉得纸质书88元太贵就弄个PDF看吧,估计也是看一遍就能搞定知识点的。