e1. 需求

*. 廉价硬件,组件失效是常态

*. 大文件,通常在100MB或者以上,也必须支持小文件,但是不需要针对小文件做专门的优化

*. 大规模的原子性追加写,数据一旦被写入后,文件就很少会被修改

*. 大规模的流式读和小规模的随机读:小规模的随机读取操作合并并排序,之后按顺序批量读取

架构

GFS存储的文件都被分割成固定大小的Chunk。在Chunk创建的时候,Master服务器会给每个Chunk分配一个不变的、全球唯一的64位的Chunk标识。Chunk服......