千家信息网

Mongodb Replica Set 读写分离

发表于:2025-01-20 作者:千家信息网编辑
千家信息网最后更新 2025年01月20日,环境:mongodb版本:2.4.6,Replica Set需求:primary压力过大,期望secondary分担读压力前言从应用程序角度来看,使用Replica Set 和使用单台mongo很像。
千家信息网最后更新 2025年01月20日Mongodb Replica Set 读写分离

环境:mongodb版本:2.4.6,Replica Set

需求:primary压力过大,期望secondary分担读压力


前言

从应用程序角度来看,使用Replica Set 和使用单台mongo很像。默认的驱动程序会连接primary节点,并且将所有读写请求都路由到主节点。但也可以通过设置驱动程序的Read Preferences 配置其他选项,将读请求路由到其他节点。但需要知道的是将读请求路由到其他节点所带来的问题...... 附:驱动程序连接到Replica Set常用的连接字符串类似:'mongodb://server1:27017,server2:27017' .具体可以查看相关驱动程序的文档,php可参考:http://php.net/manual/zh/mongo.tutorial.php.

问题是:

1: 一致性的考虑,对一致性要求比较高的应用程序是不应该从备份节点读取数据,备份节点通常由于加载问题,网络等原因,而落后于主节点几毫秒,几秒,几分钟 甚至更多。如果应用程序需要读取它自己的写操作(比如,先插入一个文档,再去查询它)

那么不应该从备份节点去读取数据,除非针对写操作,使用Write Concern定义w数值,在复制到所有备份节点之后,再返回执行成功与否。总之,如果从一个落后的备份节点读取数据,就要牺牲一致性。如果希望写入操作返回之前被复制到所有的副本集成员,就要牺牲写入速度。

2: 如果路由到的备份节点,其中一台挂了,那么其他节点将承担其相应的压力,需要注意此时在线节点的负载压力。

小结论是: 一般是不建议做读写分离,但是我们这里业务,写操作很少,大量的读请求,这里决定做读写分离来分担服务器压力,然后慢慢过度到分片。


什么是Read Preference?

Read Preference 描述了mongodb 如何将请求路由到副本集的节点,默认下,会路由到primary节点

Read Preference 的几个模式:

primary : 默认的模式,所有读写,都路由到primary节点

primaryPreferred :大部分情况,操作从primary节点读数据,除非primary节点不可用

secondary: 所有操作从secondary节点读取数据

secondaryPreferred:大多数情况,操作从secondary节点读取数据,除非所有secondary节点不可用.

nearest:从最小的网络的延迟的那个节点读取数据,不管节点的类型


什么是 getLastError?

http://docs.mongodb.org/v2.4/reference/command/getLastError/#dbcmd.getLastError

驱动程序在执行一个写操作后,会执行getLastError ,然后通过返回的信息来判断是否执行成功,返回的可以是:

1 :null ,说明执行成功

2 : 一个最后的错误描述

getLastError 可以有下面的选项来配置write concern:

j or "journal" option:

它会确认monod实利写入journal数据到磁盘,保证数据在突然关机的情况下不会丢失 栗子:

> db.runCommand( { getLastError: 1, j: "true" } )

note: If you set journal to true, and the mongod does not have journaling enabled, as with nojournal, then getLastError will provide basic receipt acknowledgment, and will include a jnote field in its return document.

w option:

0 : 禁用基本的acknowledgment写操作,返回socket异常和网络异常

1 : 提供acknowledgment 的写操作,在单机或者副本集的primary节点

>1 : 保证写操作成功的应用到副本集指定的节点(包含primary)

majority : 确认副本集成员多数写入成功

wtimeout option:

设置write concern超时的超时时间,如果不指定或指定为0 在某些情况下可以导致写操作一直block.


什么是Write Concern?

Write concern: 当一个mongodb的写入操作成功执行后什么时候返回给客户端.通过getLastError实现.

mongodb 提供不同的等级以方便客户端特殊的请求Write Concern Levels:

Unacknowledged: mongod不会确认写入是否成功,客户端也不会提示是否报错,除非是网络错误(在此版本之前是默认的级别).设置方法: 在你的驱动程序上设置此指定w为0.

Acknowledged: mongodb 会确认写入是否成功,客户端也可以获取到网络,复制,或者其他的错误.(目前默认的级别)

设置方法:在你的驱动程序上设置此指定w为1.

默认的write concern 会调用getLastError( 不带参数)来确认是否执行写入成功, 所以也可以在副本集中通过修改默认的getLastErrorDefaults来实现 write concern的级别的更改,这里没有修改mongo 的默认配置,是通过修改驱动程序的配置来实现.

getLastError: http://docs.mongodb.org/v2.4/reference/command/getLastError/#dbcmd.getLastError

getLastErrorDefaults: http://docs.mongodb.org/v2.4/reference/replica-configuration/#local.system.replset.settings.getLastErrorDefaults

Journaled :mongodb 会在数据提交到 journal 后才返回写操作成功.mongod服务必须开启journal,mongodb2.4默认是开启的. 另外在副本集中,只要primary的journal 写入成功就返回.还可以增加mongodb 提交到journal的频率来减小此种方式的延迟:http://docs.mongodb.org/v2.4/reference/configuration-options/#journalCommitInterval设置:指定w为1并且指定 j=true.

Replica Acknowledged:可以保证写操作写入到副本集的成员后才返回成功 . 设置w 大于1 , 比如2 是保证2个成员写入成功后返回.

如何设置mongodb的读写分离?

1: 应用程序设置write concern 看这里: http://api.mongodb.org/?_ga=1.237665031.647167877.1420012424

php栗子:

2: mongodb Replica Sets 修改默认的 getLastError (getLastErrorDefaults 的设置只会在getLastError 命令没有其他参数的情况下生效):

cfg = rs.conf()cfg.settings = {}cfg.settings.getLastErrorDefaults = {w: 3,wtimeout: 6000}rs.reconfig(cfg)

以上配置意思:数据成功写入3个节点后返回,其中包含了primary.最好设置wtimeout,当指定w的数值比副本集的成员多的情况下,写入操作会一直被block. 另外 wtimeout设置为0 意味这一直不超时.


参考:

http://docs.mongodb.org/v2.4/core/write-concern/

http://docs.mongodb.org/v2.4/reference/write-concern/

http://docs.mongodb.org/v2.4/core/replica-set-write-concern/

http://docs.mongodb.org/v2.4/reference/command/getLastError/#dbcmd.getLastError

0