Hadoop从诞生至今已经十三年了。2006年诞生大数据,2008年成为Apache的顶尖项目,成为国内外互联网大数据的标准配置之一。长久以来,想要入行大数据开发Hadoop也是必学。最近确对Hadoop哀声一片,更多喊得是拥抱云计算,摒弃Hadoop。

目前有一个很悲观的问题,Hadoop正在快速的失去原本属于它的市场。   该领域曾经的领头羊 Cloudera、Hortonworks 和 MapR 三家公司最近步履蹒跚,过去作为数据宠儿的他们可以筹措到源源不断的巨额投资,英特尔公司就曾向 Cloudera 注入 7.66 亿美元,这仅仅是一轮投资的数额,而有趣的是在去年年底Cloudera 和 Hortonworks 宣布合并,并且公告声称这将是“merger of equals(平等的合并)”(也可能是这两家公司无法独自存活了),然鹅MapR 成为了牺牲品,根据 LinkedIn 的数据,在过去两年中,MapR 公司缩水了 29%,Cloudera的股价一下子暴跌40%。  

之前的大数据领域过度炒作,泡沫破灭后归于现实,Hadoop领头羊步履蹒跚。MongoDB数据库越来越受欢迎,与老牌数据库MySQL和Oracle形成三足鼎立的姿态。与MongoDB相似的Elasticsearch分布式搜索和分析引擎背后的Elastic公司一个季度的收入激增70%,员工人数增加一倍。看到这里就纳闷了,MongoDB和Elasticsearch等技术应该是无法撼动Hadoop的,但是现在确发展形式一片大好?   个体开发人员拥抱云   个体假发人员对云的追捧是一个原因。虽然Cloudera、Hortonworks和MapR拼命地从内部部署产品发展而来,来自AWS、微软Azure和谷歌的云原生方案都共同提供了“完全集成的产品,它们的购置成本更低,扩展起来费用更省。”Hadoop最主要的用途一直是廉价存储。云存储变得更便宜,加上S3+ EMR及其他服务的用户体验要好上百千倍。显然,Hadoop可能是传统专有数据仓库的出色替代品,但远不如像基于云的Snowflake这些更现代化的方法那么好。  

“没有人知道这些 Hadoop 公司到底在做什么”。Hadoop 供应商争先恐后地为他们的 Hadoop 产品添加各种开源插件(Impala、Pig、Hive、Flume),发明“解决方案技术栈”,让Hadoop产品更加的繁琐和累赘,成本也越来越高。对比上云,MongoDB与Elasticsearch也是因为它们既能解决了Hadoop相同的问题,使用还比Hadoop简单,简单直接的方案和低廉的成本更适合个体开发人员。  

如今,Cloudera 在其网站首页以粗体字写着:“我们为任何数据提供企业数据云,从 Edge 到 AI ”(We deliver an Enterprise Data Cloud for any data, anywhere, from the Edge to AI)。不再是 Hadoop 和 CDH,不再是大数据。现在他们做企业云和人工智能。Hadoop现在真的很糟糕吗?并没有,Hadoop的过去十年是被炒的火热的技术,非常多的企业在购买这个技术,甚至是一些创业公司也在购买并使用这个技术,“大数据”的炒作和泡沫告诉各个企业,Facebook、LinkedIn、Google这些企业的成功是可以复制的,利用好大数据的力量你也可以达到这样的规模,变得一样成功。总之,“大数据”在销售的不是技术,而是在把IT巨头的成功卖给这些传统企业和创业公司。  

一个十年的结束,一个十年的开始。  

大数据前十年处于一个飞速发展的时期,但是并不代表有些什么新的技术突破可以取代掉“大数据”,Hadoop依然是一种可行的技术,它的时代并没有结束,真正结束的是“大数据”炒作的时代结束了。现在的热门趋势是AI和机器学习,它们讲再次循环一个十年,营销人员不断的推销新软件,还是以IT巨头为代表,让传统行业为其买单,吹起下一个科技泡沫。而接下来的十年Hadoop该何去何从?它还值得你学习吗?   Hadoop的时代并没有结束   个体用户会继续追求简单直接和低成本,大量的需求会出现越来越多的云厂商,这对Hadoop发展很不利,未来将面临更多的挑战。  

很多企业的数据是远远谈不上大数据的范畴的。但是企业只要还在运营,就一定能产生数据,运营的时间越长久,规模越大就一定会遇到“大数据问题”,这是种必然的现象。大数据技术现在只有脱下光鲜亮丽的外衣,脱离聚光灯的照射慢慢沉淀,才会有更多机会的发展,Hadoop技术始终还是值得你学习的。

【凡本网注明来源非中国IDC圈的作品,均转载自其它媒体,目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。】

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-08-24 09:38:00
大数据资讯 关注县域数据能力建设,抢占产数业务发展先机
2023年《数字中国建设整体布局规划》正式发布,数据能力已成为我国区域发展的底座和创新引擎。 <详情>
2023-03-30 11:15:07
云资讯 分布式时代已至,数据如何更有价值?
无论是连通各大集群内大型超大型数据中心,还是连接边缘侧小型、边缘数据中心,分布式云计算都已成为这张算力网络最重要的支撑。在此背景下,云计算步入分布式时代。 <详情>
2023-03-01 19:27:00
市场情报 FlagOpen大模型技术开源体系,开启大模型时代“新Linux”生态
大数据+大算力+强算法=大模型”是当前人工智能发展的主要技术路径。语言大模型ChatGPT成为现象级应用,人工智能进入普及应用的新时期。 <详情>
2023-01-09 09:36:46
大数据资讯 我国互联网广告数据匿名实施服务正式上线
《指南》形成的“技术保障、评估规制、过程控制”的互信制衡机制,适用于各类互联网广告业务,包括广告投放、程序化交易、广告监测等应用场景下的数据匿名化处理。 <详情>
2022-12-30 10:10:19
大数据资讯 中国移动磐维数据库正式发布
未来,随着数据库功能和稳定性等进一步增强,磐维数据库将在中国移动内外部的广泛应用中积累更多复杂业务场景实践经验,进一步提升数据库产品的核心技术能力,助力数智化转 <详情>