Hadoop Namenode元数据持久化机制与SecondaryNamenode的作用是什么
这篇文章将为大家详细讲解有关Hadoop Namenode元数据持久化机制与SecondaryNamenode的作用是什么,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。
我们都知道namenode是用来存储元数据的,他并不是用来存储真正的数据。
那么他的元数据怎么进行持久化呢!
FsImage
文件系统的镜像文件叫fsImage,它包括了文件和块信息的映射,还有文件系统的属性信息。
datanode启动的过程中 首先会向namenode注册块信息,这些块信息就是存储在namenode的FsImage中的。
EditLog
对于文件系统的每一次更改,例如,增加文件,删除文件等操作都会被写入Edit Log 这个问题件中。
同样的,修改文件系统的副本因子配置,也会被写入Edit Log文件。
EditLog 文件和fsImage文件都存储在文件系统的本地路径中。
namenode在内存中存储了,整个文件系统的镜像和文件块映射信息。
元数据是可以被合并的,因此namenode有4GB的内存,就足以存储巨量的文件和目录。
namenode启动过程中发生了什么呢?
1、从硬盘读取FsImage 和EditLog文件。
2、将EditLog文件中的所有操作信息写入FsImage中。产生一个新的FsImage文件- - - -这一操作被称为checkpoint
3、产生一个新的空的EditLog文件
namenode启动的时候checkponit
namenode运行过程中和fsImage 与 EditLog的交互操作
关于Hadoop Namenode元数据持久化机制与SecondaryNamenode的作用是什么就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。