-
答案 1:
我所了解的主要有两点。第一,以前高性能计算里的存储和计算是分开的,而且采用的是“移动数据到计算”的策略;而GFS采取的是“移动计算到数据”策略,在典型的MapReduce部署中计算和存储都在同一个集群中进行。第二,就是你说的,GFS是为廉价的PC集群设计,机器出错的概率大,因而GFS实现了软件的RAID,也就是多份数据备份。 -
答案 2:
同NAS或者早期的分布式文件系统相比,GFS主要有2个优点: 1. 实现自动的负载均衡和容错机制。 2. 提供了非常好的可扩展性,集群存储空间可以随机器数线性扩展。 “为廉价的PC集群设计”只是说GFS设计假设中,认为每个数据节点down机都是一个正常情况,并在GFS层进行了容错,可以保证在节点频繁down机时,系统仍然能够正常服务,这无疑降低了集群的机器成本和运维成本。 GFS和mapred最有创意的就是“移动计算到数据”的策略,其实是基于“计算逻辑简单,数据量大”的假设,这也就是mapred的特点,换句话说GFS是为mapred量身定制的分布式文件系统。
GFS 针对传统分布式文件系统而言最大创新点在哪?
2012-01-19 20:12:28 来源: 点击:
相关热词搜索:
上一篇:为什么人类大多数是右撇子?
下一篇:国内有什么服务可以本地上传音乐,然后在云端听?