ApacheHadoop
作为大数据的核心平台,Apache Hadoop在2014年展现了爆发式的发展。世界顶级公司如Oracle、IBM、Microsoft等都将自己的大数解决方案建立在Hadoop之上,因此掌握Hadoop最核心技术 (HDFS, MapReduce,Flume, Oozie, Hive, Pig, HBase, and YARN) 的技术人员在职场上的需求将越来越大。
ApacheSpark
ApacheSpark作为下一代大数据的核心引擎,采用快速崛起的内存计算技术是MapReduce风格分析框架更快和更简洁的替代方案。Spark需要专业技术进行编程和执行,因此知晓此技术的专业人员更有更广的职业空间。
NoSQL
大数据的量大和数据格式的样式多属性为NoSQL提供了非常强劲的应用需求,诸如MongoDB、Couchbase等分布式、可扩展的NoSQL数据库系统正在为越来越多的(大)数据应用所采用。NoSQL数据库通常被作为 Hadoop分析应用的数据源。在大数据职场中,Hadoop 和 NoSQL是非常闪亮的两项技能。
MachineLearning & Data Mining (机器学习和数据挖掘)
机器学习是数据智能化的必要手段,因此机器学习在2014年是大数据中的最热门的领域之一,2015年将更上一层楼。懂得并善于运用机器学习来搭建像分类、推荐和个性化系统等预测分析应用程序的人成为职场宠儿。
Statisticaland Quantitative Analysis(统计和定量分析)
大数据分析过程实际上是一个集数据建模、统计计算和定量分析于一体的综合应用模型,因此了解并掌握一些统计工具如R、SAS、MathLab、SPSS等将使大数据从业人员如虎添翼。
SQL
懂得并精通SQL技能的重要性不言而喻。
DataVisualization (数据可视化)
大数据蕴含大价值是不争的事实。怎样挖掘、懂得并利用这些价值才是大数据分析的商业目的。数据可视化就是将大数据分析结果以直接、直观、易懂的方式表现出来。目前市场流行的BI工具有MSBI(Excel),Tableau,Qlikview等。
ProgrammingLanguage(编程语言: Python,Java,Scala)
Hadoop及其生态系统提供了强大的功能,建立在其上的应用都需要进行二次开发;因此精通Python、Java、或Scala等编程语言并拥有编程应用经验的开发人员具有优势。根据 Wanted Analytics的统计, 招聘具有数据分析背景的“计算机编程人员”增长了337%。具有传统应用程序开发和新兴数据分析能力的人将会有极大的职业选择空间。
Creativityand Problem Solving (创造力和问题解决能力)
不管技术和工具有多先进,拥有丰富的创造力和强劲的问题解决能力永远是职场中的胜利者。