千家信息网

如何看待Hadoop

发表于:2024-11-25 作者:千家信息网编辑
千家信息网最后更新 2024年11月25日,如何看待Hadoop,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。1. 2013 全球数据总量 4.4 ZB 预计2020 44ZB 1
千家信息网最后更新 2024年11月25日如何看待Hadoop

如何看待Hadoop,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。

1. 2013 全球数据总量 4.4 ZB 预计2020 44ZB 1ZB=1000EB=1000 000 PB 1PB=1024TB
2. 个人产生的数据在不断增长 物联网产生的数据
3. 大数据胜于好算法
  • 对于某些应用来(譬如根据以往的偏好来推荐电影和音乐),不论算法有多牛,基于小数据的推荐效果往往都不如基于大量可用数据的一般算法的推荐效果

多硬盘读取遇到的问题
  • 硬件故障

  • 数据的正确性如何保证

MapReduce
  • 每次查询需要处理整个数据集或至少一个数据集的绝大部分

  • 本质是一个批处理系统 不适合交互式分析

硬盘发展趋势: 寻址时间的提升远远不敌于传输速率的提升
MapReduce 适合一次写入、多次读取数据应用,关系型数据库则更适合持续更新的数据集
hadoop 对非结构化或半结构化数据非常有效
网格计算
  • hadoop 尽量在计算节点上存储数据,以实现数据的本地快速访问。数据本地化特性是Hadoop 数据处理的核心,并因此而获得良好的性能

志愿计算
hadoop 三大设计目标
  • 为只需要短短几分钟或几个小时就可以完成的作业提供服务

  • 运行于同一个内部有高速网络连接的数据中心内

  • 数据中心内的计算机都是可靠的、专门的硬件

看完上述内容,你们掌握如何看待Hadoop的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注行业资讯频道,感谢各位的阅读!

0