租房买房买生意上iU91
查看: 1067|回复: 0
打印 上一主题 下一主题

大数据真的来了ARE YOU READY?

[复制链接]   [推荐给好友]
跳转到指定楼层
楼主
发表于 2014-10-21 11:49 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
大数据真的来了ARE YOU READY

听说过大数据吗?没听说过?那你太落伍了!2013年美国高薪技术岗位排行榜上大数据居首!大数据和你有关吗?无关?那你即将社会“淘汰”!这些话有些夸张,但不无道理。你用过微信、QQgoogle、百度、淘宝、ebayfacebook、微博、tiwtter、网络云盘等这些之中的任何一个吗?它们都和大数据有关。实际上还有很多你没注意的地方已经或将要用到强大的大数据技术。

21世纪是数据信息大发展的时代,移动互联、社交网络、电子商务等极大拓展了互联网的边界和应用范围,各种数据正在迅速膨胀并变大。互联网(社交、搜索、视频、微博、电商包括淘宝,ebayamazon)、移动互联网(app、广告、行为、位置)、物联网(传感器,智慧地球)、车联网、GPS、遥感数据(天文望远镜拍摄的图像、数据、气象学里面的卫星云图数据)、医学影像、安全监控(视频)、金融(银行、股市、保险)、电信(通话、短信)都在疯狂产生着数据。

  • 过去3年数据量比以往数万年还多
  • 2020年数据产出量将比2009年的44倍还多
  • 2006年全球生成、复制的数字化信息量大约16.1万PB,当年的信息产生量约是历史上图书信息总量的3000倍
  • 过去3年数据量比以往数万年还多
  • 2020年数据产出量将比2009年的44倍还多
  • 2006年全球生成、复制的数字化信息量大约16.1万PB,当年的信息产生量约是历史上图书信息总量的3000倍


目前业界较为统一的看法是大数据具有如下4个特点:

  • Volume 数据量大:通常PB级(注:数据量级别的次序KB ≈ 103-> MB ≈ 106 ->GB ≈ 109 -> TB ≈1012 -> PB ≈ 1000TB -> EB -> ZB -> YB -> NB -> DB,每一级差1000倍)是大数据层次的临界点,当数据达到这一级别一般的每点服务器都难以应对,几乎所有的传统数据库管理系统都无法应对。有人会说我哪有那么多数据要管理呀?但事实如同上一段所讲如果想要过真正的信息化生活,数据远不止这些,而且数据这些数据还在不断增加!
  • Velocity 速度:对于很多大数据应用而言,数据量的增加是极快速的,例如社交网络上形成的各式各样的数据,从另一个角度看大数据管理系统还必须要在短时间内形成答案,否则处理结果就是过时和无效的,例如物联网和传感网络中的数据。
  • Variety 多样性:比大更重要的是数据的复杂性,有时甚至大数据中的小数据如一条微博就具有颠覆性的价值。大数据不仅仅是“大”,结构复杂,样式繁多才更有意义,但也更难管理。企业内部的经营交易信息;物联网世界中商品,物流信息;互联网世界中人与人交互信息,位置信息等是大数据的主要来源。这些数据可能是象财务报表一样有结构的,也可能象议论文一样有一定结构,当然也可能散文一样完全没有固定!而绝大多数传统数据库只善于管理象报表一样的结构化数据。
  • Value 价值:大的数据里往往隐含着大的价值,你可否利用google写过英文?可否用微信或人人网找过朋友?在大数据海洋寻宝、挖掘大数据的价值就象沙里淘金,金子的确存在,也的确很多,但隐藏在在海量数据的中等待人们去挖掘稀疏但极其珍贵的信息。

能够在不同的数据类型中,进行交叉分析的技术,是大数据的核心技术之一。语义分析技术,图文转换技术,模式识别技术,地理信息技术等,都会在大数据分析时获得应用。大数据的应用不仅仅是精准营销,管理大数据难,但理解大数据更难,目前大数据管理多从架构和并行等方面考虑,解决高并发数据存取的性能要求及数据存储的横向扩展,但对非结构化数据的内容理解仍缺乏实质性的突破和进展,这是实现大数据资源化、知识化、普适化的核心。

正是因为有强烈的市场,但又有较高技术门槛,属于标准的“高”-“大”-“上”技术,大数据成为企业竞相追逐的热点,也成为个人最值得把握技能,2013年美国高薪技术岗位排行榜(Dice Tech Salary SurveyResults – 2013[http://marketing.dice.com/pdf/Dice_TechSalarySurvey_2013.pdf])上大数据居首!其中TOP 1-3分别为HadoopBig DataNoSQL,全都与大数据有关!

我们该如何应对大数据呢?实际中GoogleIBM Microsoft Oracle Amazon Yahoo, Facebook,阿里巴巴,百度,腾讯等等大公司都有自己的大数据解决方案,但它们的大数据方案中出现频度最高的Hadoop,虽然Hadoop采用了google的大数据解决方法,但是作为Apache的开源项目,目前已经成为实事上的大数据解决王者,基于Hadoop的源代码MicrosoftYahooFacebook,阿里巴巴等等都开发了自己定制的大数据管理系统。当然研究学习大数据技术还应考虑 数据采集技术包括ETL工具,数据存取技术包括关系数据库和NoSQL等, 基础架构支持包括云存储、分布式文件系统等, 计算结果展现包括云计算、标签云、关系图等等。

大数据真的来了,你是否已经准备好了呢?

欲了解更多详细信息,请致电416-827-2652或访问www.it21learning.com

您需要登录后才可以回帖 登录 | 免费注册

本版积分规则

Copyright © 1999 - 2024 by Sinoquebec Media Inc. All Rights Reserved 未经许可不得摘抄  |  GMT-5, 2024-12-18 04:19 , Processed in 0.040810 second(s), 32 queries .