大数据领域的三驾马车
2003 年的 11 月份,Google 发表了第一篇论文《The Google File System》,后面我们简称 GFS
解决的是分布式存储的问题
2004 年 12 月份,Google 发表了第二篇论文《MapReduce:Simplified Data Processing on Large Clusters》
解决的是分布式计算的问题
2006 年的时候,Google 发表了第三篇论文,叫《Bigtable: A Distributed Storage System for Structured Data》
大规模结构化数据的存储和查询问题
黑话
玩转大数据的时候,常常说让大象能跳舞,形象的强调 Hadoop 给大数据带来的灵活计算的能力