hadoop
2016-05-26 13:41:02 0 举报
Hadoop是一个开源的分布式计算框架,它允许用户在大量计算机集群上存储和处理大数据。Hadoop的核心组件包括HDFS(Hadoop Distributed File System)和MapReduce。HDFS提供了一个高度容错性的文件系统,能够在多台机器上存储数据,而MapReduce则是一种编程模型,用于在集群上并行处理大量数据。Hadoop的设计目标是能够处理PB级别的数据,并且能够在故障发生时自动恢复。Hadoop已经被广泛应用于各种领域,包括搜索引擎、数据分析、机器学习等。