Mongodb副本集实现
MongoDB副本集概述
以下图片摘自MongoDB官方文档:http://docs.mongodb.org/manual/core/replication-introduction/
Primary节点接收客户端所有的写操作,整个副本集只会有一个primary节点。MongoDB副本集提供严格的一致性。主节点将所有的操作写入一个叫oplog的capped collection(这个collection的大小一般为磁盘剩余空间的5%,不同的系统可能不一样,详见http://docs.mongodb.org/manual/core/replica-set-oplog/)中,secondary节点通过复制oplog并执行oplog中的所有操作,因为对oplog的执行是幂等的,所以secondary节点上的数据可以保持和primary节点一样,当然这有一个"追赶"(catch up)的过程,会存在一定的落后(Lag)有时候因为网络延迟或宕机导致从节点永远赶不上主节点,这时候需要采取人为的干预了(后面会说到Resyncing Member of Replica Set)。
默认所有的读操作也是走的primary节点,当然客户端可以选择从secondary节点进行读取操作以减小主节点的压力(后面会对读写分离有详细说明)。
各个节点之间是通过心跳机制来维持联系的,当主节点无法和集群中其他节点通信超过10秒,集群会从剩下的节点中选择一个secondary作为primary,这个过程叫做选举(election),每个secondary节点都有一个优先级priority来参与投票(也可以有没有投票权的secondary节点),priority值越大就越优先成为主节点(所有的节点可以有相同的优先级,默认值都是1)。election的策略不仅仅就是根据priority值来,会综合很多其他的因素。总之MongoDB通过heartbeat和election机制实现了自动的Failover:
副本集要求参与选举投票(vote)的节点数为奇数,这很容易理解。当我们实际环境中因为机器等原因限制只有两个(或偶数)的节点,这时为了实现Automatic Failover引入另一类节点:仲裁者(arbiter),仲裁者只参与投票不拥有实际的数据,因此它对物理资源要求不严格。
上面已经提到了primary,secondary和arbiter,整个MongoDB副本集群中除了这三种类型的节点还有其他几种:
Secondary-Only:这种类型的节点和secondary节点一样拥有数据副本,但是它们在任何情形下都成为不了primary节点。
Hidden:这种类型的节点对客户端程序来说是不可见的,同样也不能成为primary节点,但是Hidden成员能够参与选举投票。
Delayed:这种类型的成员通过人为的设置,可以指定一个时间来延迟从primary节点同步数据。Delayed成员的作用在于帮助集群从一些误操作中恢复,比如管理员误删除了某个集合。不至于迅速扩散到整个集群中。因此Delayed节点必须不能成为primary节点(priority为0)并且是Hidden的。
Non-Voting:这就是上面提到了没有选举权的secondary节点。这种类型的节点一般当集群节点数超过12才会需要。
简单副本集的搭建
主:192.168.1.100
从:192.168.1.101,192.168.1.102
1.首先已经安装完mongodb(我们使用rpm安装)。
mongodb默认端口为:27017
2.修改两个从节点配置文件
service mongod stop vim /etc/mongod.conf
取消注释replSet,设置其名称;并添加replIndexPrefetch项。如下:
重启服务:
service mongod start
3.登录到主节点命令行中
mongo
>rs.status() { "startupStatus" : 3, "info" : "run rs.initiate(...) if not yet done for the set","ok" : 0,"errmsg" : "can't get local.system.replset config from self or any seed (YCONFIG)"}
启动一个新的副本集
>rs.initiate() {"info2" : "no configuration explicitly specified -- making one","me" : "Centos:27017","info" : "Config now saved locally. Should come online in about a minute"ok" : 1}
在Mongo客户端使用命令rs.initiate()来启动一个新的副本集。
我们可以使用rs.conf()来查看副本集的配置
查看副本集状态使用 rs.status() 命令
副本集添加成员
添加副本集的成员,我们需要使用多条服务器来启动mongo服务。进入Mongo客户端,并使用rs.add()方法来添加副本集的成员。
语法
rs.add() 命令基本语法格式如下:
>rs.add(Host_NAME:PORT)
添加两个从节点成员:
testSet:PRIMARY> rs.add("192.168.1.101") --默认27017不用指定{ "ok" : 1 }testSet:PRIMARY> rs.add("192.168.1.102"){ "ok" : 1 }
此时,查看副本集状态:
testSet:PRIMARY> rs.status(){"set" : "testSet","date" : ISODate("2017-03-22T07:58:26Z"),"myState" : 1,"members" : [{"_id" : 0,"name" : "Centos:27017","health" : 1,"state" : 1,"stateStr" : "PRIMARY","uptime" : 1293,"optime" : Timestamp(1490168420, 1),"optimeDate" : ISODate("2017-03-22T07:40:20Z"),"electionTime" : Timestamp(1490168213, 11),"electionDate" : ISODate("2017-03-22T07:36:53Z"),"self" : true},{"_id" : 1,"name" : "192.168.1.101:27017","health" : 1,"state" : 2,"stateStr" : "SECONDARY","uptime" : 1146,"optime" : Timestamp(1490168420, 1),"optimeDate" : ISODate("2017-03-22T07:40:20Z"),"lastHeartbeat" : ISODate("2017-03-22T07:58:25Z"),"lastHeartbeatRecv" : ISODate("2017-03-22T07:58:25Z"),"pingMs" : 1,"syncingTo" : "Centos:27017"},{"_id" : 2,"name" : "192.168.1.102:27017","health" : 1,"state" : 2,"stateStr" : "SECONDARY","uptime" : 1086,"optime" : Timestamp(1490168420, 1),"optimeDate" : ISODate("2017-03-22T07:40:20Z"),"lastHeartbeat" : ISODate("2017-03-22T07:58:25Z"),"lastHeartbeatRecv" : ISODate("2017-03-22T07:58:24Z"),"pingMs" : 1,"lastHeartbeatMessage" : "syncing to: Centos:27017","syncingTo" : "Centos:27017"}],"ok" : 1}
测试:
在主节点创建新库,并插入新数据:
testSet:PRIMARY> show dbs;admin (empty)local 6.075GBtestSet:PRIMARY> use testswitched to db testtestSet:PRIMARY> show dbsadmin (empty)local 6.075GBtestSet:PRIMARY> db.test.insert({"name":"菜鸟教程"})WriteResult({ "nInserted" : 1 })testSet:PRIMARY> show dbsadmin (empty)local 6.075GBtest 0.078GB
查看从节点信息:
testSet:SECONDARY> show dbs;admin (empty)local 6.075GBtest 0.078GBtestSet:SECONDARY> db.test.find(){ "_id" : ObjectId("58d231485934aa983f070c99"), "name" : "菜鸟教程" }
问题及解决:
1.初始化副本集时报错:
>rs.initialte(){ .... "errmsg" "couldn't initiate : can't find self in the replset config" ,"ok" : 0 ....}
解决:编辑hosts文件添加主机名称解析,之后重新初始化副本集。
[root@Centos ~]# vim /etc/hosts127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4::1 localhost localhost.localdomain localhost6 localhost6.localdomain6127.0.0.1 Centos
2.添加副本集成员时报错:
testSet:PRIMARY> rs.add("192.168.1.101:27017"){"errmsg" : "exception: need most members up to reconfigure, not ok : 192.1.101:27017","code" : 13144,"ok" : 0}
解决:由于从节点配置文件中bind绑定为127.0.0.1的ip信息,从而导致不能添加192端的ip,将其bind注释掉。
3.添加完成员,查看副本集状态时,节点一直 显示如:"stateStr" : "UNKNOWN"
解决:问题的原因是rs.initiate()默认将primary的host键设置成机器的主机名,如下:
1)可以编辑两个从节点的hosts文件添加主节点主机名和Ip信息,如:
[root@RedHat-1 ~]# vim /etc/hosts127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4::1 localhost localhost.localdomain localhost6 localhost6.localdomain6192.168.1.100 Centos
2)可以将primary的主机名改成IP地址:
cfg = rs.conf()cfg.members[0].host = "192.168.1.100:27017"rs.reconfig(cfg)