hdfs
2017-03-18 16:38:18 0 举报
HDFS(Hadoop Distributed File System)是Hadoop项目的核心子项目,它是一个高度容错性的系统,设计用于在廉价硬件上部署在大规模节点上。HDFS提供了高度的容错性(fault-tolerance)和可扩展性(scalability),可以存储PB级别的数据。它提供了一个统一的文件系统接口,用户可以通过这个接口访问和管理存储在集群中的数据。HDFS的主要特点包括:大文件存储、高吞吐量、分布式处理、容错性和可扩展性。HDFS广泛应用于大数据存储和处理场景,如日志分析、机器学习、数据挖掘等。