MongoDB复制集集群原理详解及部署

更新时间:2020-06-01点击数:文字大小:

原标题:MongoDB复制集集群原理详解及部署

复制集介绍

MongoDB中的复制集(也被称为副本)是一组维护相同数据集的mongod进程。副本集提供冗余性及和高可用,是所有生产部署的基础。简单来说,复制集有多台MongoDB组成的一个集群,集群中有一个主节点(Primary)和N个副本节点(Secondary)等,它们有相同的数据库,假如主MongoDB服务器或者MongoDB实例Down机之后,其它的副本服务器可以继续提供服务,实现数据的高可用及可靠性。

复制集群架构

术语介绍:

术语 类型 描述
Primary 主节点 负责整个集群的读写操作,包含了所有改变操作的日志
Secondary 备节点 同步主服务器所有的数据,负责集群的读取请求,主服务器宕机可以称为主节点
Arbiter 仲裁者 在主节点宕机后只进行投票,不参与选举,不同步主节点数据

此架构由一个Primary节点和两个Secondary节点组成

1)Primary节点为主节点,所有的写操作或者更改操作都只能从Primary节点中操作(复制集内的所有成员都可以接收读操作,但是,默认情况下,应用程序将其读操作指向主成员),主节点上所有的更改及写操作都会记录到oplog日志中。

2)两台Secondary节点复制Primary节点的oplog日志,通过异步的方式去执行oplog日志中的记录来和Primary节点达到数据一致性。

3)oplog作用主要是记录主节点的写入操作,充当复制源。

4)如果Primary节点无故Down机之后,复制集集群会通过投票机制在两台Secondary中选举一台升级为Primary节点。

投票选举机制

MongoDB节点之间维护心跳检查,主节点选举由心跳触发。

心跳检查MongoDB复制集成员会向自己之外的所有成员发送心跳并处理响应信息,因此每个节点都维护着该节点看到的其它所有节点的状态信息,节点根据自己的集群状态判断是否需要更新新的Primary。在实现的时候主要由两个异步的过程分别处理心跳响应和超时,每个复制集成员都会在后台运行与复制集所有节点的心跳线程,在以下几种情况下会触发状态检测过程:

•Secondary节点权重(Priority)比Primary节点高时,发起替换选举;•Secondary节点发现集群中没有Primary时,发起选举;•Primary节点不能访问到大部分成员时主动降级,降级操作会断开连接,终止用户请求等;•复制集成员心跳检测结果发生变化,比如某个节点挂了或者新增节点,发起重新投票选举规则;•超过4s没有执行状态检测过程,发起替换选举;

选举发起发起选举的节点首先需要做一些条件判断,维护主节点的有N个备用节点,备用节点中的所有节点都可能被选举成为主节点,成为主节点前每个备节点都会检测自身以及全局条件是否满足,检测条件如下:

1.是否看见复制集中是否有Majority在线2.自身Priority是否大于03.自身不为arbiter4.自身opTime不能落后于最新节点10s以上5.自身存储的集群程序按信息为最新

如果所有条件满足,则将自身添加到主节点的备用列表中,否则,将自身从列表中移除

自身检测

•MongoDB选举需要获得大多数投票才能通过,如果没有节点投反对票,且获得成票数超过有权投票节点总数的1/2,则能成为Primary。否则进入下一轮选举。为避免陷入无限重复选举,MongoDB建议复制集的成员个数为奇数,当Secondary为双数时,可以增加一个Arbiter节点。•选举过程中,复制集没有主节点,所有成员都是只读状态•选举过程很复杂,一般情况下需要5s左右进行选主。•如果新选择的主节点立刻挂掉,至少需要30s时间重新选主。

大多数的定义假设复制集内投票成员数量为N,则大多数=N/2+1,当复制集内存活成员数量不足大多数时,整个复制集将无法选举出Primary,复制集将无法提供写服务,处于只读状态。 我们按照上面的架构来举例,三台MongoDB,一台Primary,两台Secondary,主节点挂了之后,只有两台Secondary可以投票,根据公式我们来算“2/2+1=2”,也就是算大多数等于2,但是当复制集内存活的成员数量不足大多数时,我们的大多数为2,集群成员也为2,所以这两台集群成员会发起选举投票机制,如果两台Secondary节点自身条件都满足的情况下,则先发起选举节点的成员成为Primary节点 

投票成员数 大多数 容忍失效数
1 1 0
2 2 0
3 2 1
4 3 1
5 3 2
6 4 2
7 4 3

复制集群成员说明

Secondary正常情况下,复制集的Seconary会参与Primary选举(自身也可能会被选为Primary),并从Primary同步最新写入的数据,以保证与Primary存储相同的数据。Secondary可以提供读服务,增加Secondary节点可以提供复制集的读服务能力,同时提升复制集的可用性。另外,Mongodb支持对复制集的Secondary节点进行灵活的配置,以适应多种场景的需求。

ArbiterArbiter节点只参与投票,不能被选为Primary,并且不从Primary同步数据。比如你部署了一个2个节点的复制集,1个Primary,1个Secondary,任意节点宕机,复制集将不能提供服务了(无法选出Primary),这时可以给复制集添加一个Arbiter节点,即使有节点宕机,仍能选出Primary。Arbiter本身不存储数据,是非常轻量级的服务,当复制集成员为偶数时,最好加入一个Arbiter节点,以提升复制集可用性。

Priority0Priority0节点的选举优先级为0,不会被选举为Primary。比如你跨机房A、B部署了一个复制集,并且想指定Primary必须在A机房,这时可以将B机房的复制集成员Priority设置为0,这样Primary就一定会是A机房的成员。(注意:如果这样部署,最好将『大多数』节点部署在A机房,否则网络分区时可能无法选出Primary)

Vote0Mongodb3.0里,复制集成员最多50个,参与Primary选举投票的成员最多7个,其他成员(Vote0)的vote属性必须设置为0,即不参与投票。

HiddenHidden节点不能被选为主(Priority为0),并且对Driver不可见。因Hidden节点不会接受Driver的请求,可使用Hidden节点做一些数据备份、离线计算的任务,不会影响复制集的服务。

DelayedDelayed节点必须是Hidden节点,并且其数据落后与Primary一段时间(可配置,比如1个小时)。因Delayed节点的数据比Primary落后一段时间,当错误或者无效的数据写入Primary时,可通过Delayed节点的数据来恢复到之前的时间点。

优先级为0复制集成员

此架构由一个Primary节点和两个Secondary节点组成

1)此架构由一台Primary主节点和两台Secondary备节点组成,其原理就是主从复制架构的原理,两台Secondary节点同样通过oplog日志来与Primary主节点达成数据一致

2)与其不同的是在DataCenter2节点上的Secondary备用节点的实例优先级priority为0,则不参与选举,也不可能会成为Primary节点,将其优先级配置为0,主要是防止它成为主节点,这在多数据中心的部署特别有用。

3)优先级值范围为0-100(0表示不参与选举),在复制集群中,优先级高的优先成为主节点,假如我们原来集群中有三台节点,主节点优先级为2,其它两台备节点优先级为1,当我们新加入到集群一台MongoDB实例,给它优先级设置为4,则该实例在加入集群后就会自动抢夺Primary到本机。

仲裁节点架构

上图中,三个成员组成复制集群

一个主库:负责整个集群的所有写、更改操作

一个从库:通过oplog日志来与主节点数据达成一致

一个Airbiter节点,在选举中,只进行投票,不能成为主库,而且不复制Primary的任何数据,因此这个架构中只能提供一个完成的副本Secondary,Arbiter只需要很少的资源,代价是有限的冗余和容错,当Primary节点故障后,Aribiter将票数头给Secondary,使其成为Primary节点,如果Primary节点再次故障后,集群将不可用,Arbiter节点也未存储任何数据。

集群中还有其它的节点成员,但是我们用的比较少,所以此文章中没有提到。可以自行查阅官方文档:https://docs.mongodb.com/manual/core/replica-set-members/

复制集集群环境部署环境说明

本次使用一台设备多实例进行,如果你准备在多台设备上部署,你需要考虑的如下:1)时钟是否一致2)网络是否通畅3)SElinux是否关闭或者策略放通4)环境是否一致

[root@MongoDB~]#lsb_release-aLSBVersion::core-4.1-amd64:core-4.1-noarch:cxx-4.1-amd64:cxx-4.1-noarch:desktop-4.1-amd64:desktop-4.1-noarch:languages-4.1-amd64:languages-4.1-noarch:printing-4.1-amd64:printing-4.1-noarchDistributorID:CentOSDeion:CentOSLinuxrelease7.6.1810(Core)Release:7.6.1810Codename:Core[root@MongoDB~]#hostname-I10.211.55.12192.168.0.100fdb2:2c26:f4e4:0:21c:42ff:fedf:4d85

前期准备

#创建用户组useraddmongodecho'abcdef'|passwd--stdinmongod

#下载MongoDBwgethttps://fastdl.mongodb.org/linux/mongodb-linux-x86_64-rhel70-4.2.0.tgz

#添加文件打开数和mongod用户进程连接数cat>>/etc/security/limits.conf<<EOF*softnofile65536*hardnofile65536mongodsoftnproc32768mongodhardnproc32768EOF

#使下面两个文件修改为neverechonever>/sys/kernel/mm/transparent_hugepage/enabledechonever>/sys/kernel/mm/transparent_hugepage/defrag

#开机自动修改cat>>/etc/rc.local<<EOFiftest-f/sys/kernel/mm/transparent_hugepage/enabled;thenechonever>/sys/kernel/mm/transparent_hugepage/enabledfi

iftest-f/sys/kernel/mm/transparent_hugepage/defrag;thenechonever>/sys/kernel/mm/transparent_hugepage/defragfiEOF此步骤完成后

#官方给出MongoDB需要以下两个库的依赖yuminstalllibcurlopenssl-y

#解压并复制程序文件到bin目录mkdir/usr/local/mongodbtarxfmongodb-linux-x86_64-rhel70-4.2.0.tgzcp-rfmongodb-linux-x86_64-rhel70-4.2.0/bin//usr/local/mongodb/chown-Rfmongod.mongod/usr/local/moongodb/

#添加程序环境cat>>/etc/profile<<EOFexportMONGODB_HOME=/usr/local/mongodbexportPATH=$MONGODB/bin:$PATHEOF

source/etc/profile

环境配置

1)接下来使用mongod用户来操作

sumongod

2)创建文件目录

#!/bin/bashforiin270172701827019domkdir-p/usr/local/mongodb/$i/{conf,data,logs,run}done

配置文件

编辑一台配置文件,然后复制到其它实例,配置文件为yaml语法关于以下配置文件详解,请参考:”https://abcops.cn/mongodb-conf/“

cat>mongod.conf<<EOFsystemLog:destination:filepath:/usr/local/mongodb/27017/logs/mongodb.loglogAppend:trueverbosity:0logRotate:rename

storage:journal:enabled:truedbPath:/usr/local/mongodb/27017/datadirectoryPerDB:trueengine:wiredTigerwiredTiger:engineConfig:cacheSizeGB:1directoryForIndexes:truejournalCompressor:zlibcollectionConfig:blockCompressor:zlibindexConfig:prefixCompression:true

processManagement:fork:truepidFilePath:/usr/local/mongodb/27017/run/mongod.pid

net:port:27017bindIp:10.211.55.12maxIncomingConnections:65536wireObjectCheck:trueipv6:false

replication:oplogSizeMB:4096replSetName:abcops_repl

setParameter:connPoolMaxShardedConnsPerHost:200connPoolMaxConnsPerHost:200EOF

复制配置文件到目录中,并修改其端口及目录位置

#!/bin/bashforiin270172701827019docp/home/mongod/mongod.conf/usr/local/mongodb/$i/confsed-i"s/27017/$i/g"/usr/local/mongodb/$i/conf/mongod.confdone

启动MongoDB实例

启动脚本如下

#!/bin/bashforiin270172701827019do/usr/local/mongodb/bin/mongod-f/usr/local/mongodb/$i/conf/mongod.confdone

关闭脚本如下

#!/bin/bashforiin270172701827019do/usr/local/mongodb/bin/mongod--shutdown-f/usr/local/mongodb/$i/conf/mongod.confdone

三个实例启动后,不代表复制集已经搭建成功了,还需要进行复制集初始化

配置复制集

连接任何一个实例都可以进行配置

这是我连接27017的实例/usr/local/mongodb/bin/mongo--host10.211.55.12--port27017
>useadmin

>config={_id:'abcops_repl',members:[{_id:0,host:'10.211.55.12:27017',priority:2},{_id:1,host:'10.211.55.12:27018',priority:1},{_id:2,host:'10.211.55.12:27019',arbiterOnly:true},]}

>rs.initiate(config)

#以上参数解析useadmin:进入admin数据库config:配置复制集_id:'abcops_repl':指定复制集组名称,与配置文件中的replSetName参数需要保持一致members:规定的函数,不能更改_id:设置组成员的ID编号,可以自定义,我这里为0、1、2host:指定加入复制集成员的IP地址及端口,我们在配置文件中指定了bindIp为10.211.55.12,这里就不能写127.0.0.1,必须写为bind_Ip指定的地址priority:指定优先级0-100,优先级最高的成为Primary节点,优先级为可选选项,如果不指定默认都为1arbiterOnly:是否开启仲裁节点true/false

rs.initiate(config):初始化复制集配置

以上参数图示如下,给你提供下参照

图中开始为SECONDARY,代表复制集集群正在进行选举Primary节点,大概5s左右,根据选举机制选举成功后,成为主节点的SECONDARY状态变为PRIMARY

复制集常用命令

1)查看谁是主节点

abcops_repl:PRIMARY>db.isMaster

2)查看当前复制集集群中成员的配置

abcops_repl:PRIMARY>rs.conf

3)查看复制集集群成员状态

abcops_repl:PRIMARY>rs.status

4)新增节点到复制集新增节点之前,该实例的配置中的replSetName复制集名称,必须和集群一致

abcops_repl:PRIMARY>rs.add("10.211.55.12:27020")

5)新增仲裁节点

abcops_repl:PRIMARY>rs.addArb("10.211.55.12:27020")

6)从复制集内删除节点

abcops_repl:PRIMARY>rs.remove("10.211.55.12:27020")

7)检查oplog日志时间和大小

abcops_repl:PRIMARY>rs.printReplicationInfoconfiguredoplogsize:4096MBloglengthstarttoend:2422secs(0.67hrs)oplogfirsteventtime:WedSep11201912:22:13GMT+0800(CST)oploglasteventtime:WedSep11201913:02:35GMT+0800(CST)now:WedSep11201913:02:37GMT+0800(CST)

8)降级服务器此操作只能在PRIMARY上操作通过执行rs.stepDown命令将当前主服务器主动降级为备用节点,120单位为s,为120秒内这个实力不能把自己选为PRIMARY角色,120秒后由于它本身的优先级较高,所以会重新抢占PRIMARY节点。

abcops_repl:PRIMARY>rs.stepDown(120)

9)允许在Secondary节点可以进行查询在副本节点上操作

rs.slaveOk

10)查看当前连接

db.getMongo

修改优先级

修改27018的优先级为3,使其优先级超过27017实例,夺得PRIMARY角色,此操作需在PRIMARY上执行

abcops_repl:PRIMARY>config=rs.confabcops_repl:PRIMARY>config.members[1].priority=33abcops_repl:PRIMARY>rs.reconfig(config){"ok":1,"$clusterTime":{"clusterTime":Timestamp(1568179129,1),"signature":{"hash":BinData(0,"AAAAAAAAAAAAAAAAAAAAAAAAAAA="),"keyId":NumberLong(0)}},"operationTime":Timestamp(1568179129,1)}

abcops_repl:PRIMARY>rs.confabcops_repl:SECONDARY>db.isMaster

#以上参数解析config=rs.conf:将现有的配置读取到变量中进行存储config.members[1].priority=3:修改变量中的值,1是指执行rs.conf中看到节点的顺序,不是ID号哦,rs.conf看到的顺序是从0开始排序,三个副本集排序就是0-3rs.reconfig(config):将修改后的数据同步到配置,使修改生效

rs.conf:查看当前配置,可以看到优先级哦db.isMaster:查看谁是Primary节点

复制测试

1)插入数据

#连接当前Primary节点/usr/local/mongodb/bin/mongo--host10.211.55.12--port27018

#进入abcops数据库,在documents文档中插入以下JSON格式的数据abcops_repl:PRIMARY>useabcopsabcops_repl:PRIMARY>db.documents.insert({name:"xuweiliang",age:25,Job:"DevOps"})

#查看documents文档中的数据abcops_repl:PRIMARY>db.documents.find{"_id":ObjectId("5d78863768fbf9eac4704232"),"name":"xuweiliang","age":25,"Job":"DevOps"}

#查看复制节点状态abcops_repl:PRIMARY>rs.printSlaveReplicationInfosource:10.211.55.12:27017syncedTo:WedSep11201913:30:42GMT+0800(CST)0secs(0hrs)behindtheprimary

2)登录Secondary节点查看

/usr/local/mongodb/bin/mongo--host10.211.55.12--port27017

abcops_repl:SECONDARY>rs.slaveOk#运行副本节点可进行查询abcops_repl:SECONDARY>showdbs#查看当前节点的数据库abcops0.000GBadmin0.000GBconfig0.000GBlocal0.000GBabcops_repl:SECONDARY>useabcops#abcops数据库已经从主节点同步至此switchedtodbabcopsabcops_repl:SECONDARY>db.getCollectionNames#以下连续三个命令都是查看进入到abcops库中的文档命令["documents"]abcops_repl:SECONDARY>showcollectionsdocumentsabcops_repl:SECONDARY>showtablesdocumentsabcops_repl:SECONDARY>db.documents.find#查看文档中的内容{"_id":ObjectId("5d78863768fbf9eac4704232"),"name":"xuweiliang","age":25,"Job":"DevOps"}

创建复制集中的账户

1)连接到主节点,创建用户以下创建的用户及权限和角色请参考下面用户权限说明

/usr/local/mongodb/bin/mongo--host10.211.55.12--port27018abcops_repl:PRIMARY>useadmin

abcops_repl:PRIMARY>db.createUser({user:'abcops',pwd:'123456',roles:[{role:"root",db:"admin"}]})Successfullyaddeduser:{"user":"abcops","roles":[{"role":"root","db":"admin"}]}

#查看所有创建的用户信息abcops_repl:PRIMARY>showusers

用户中权限的说明

权限 说明
Read 允许用户读取指定数据库
readWrite 允许用户读写指定数据库
dbAdmin 允许用户在指定数据库中指定管理函数,如(索引创建、删除、查看统计访问system.profile)
userAdmin 允许用户向system.users集合写入,可以找指定数据里面创建、删除和管理用户
clusterAdmin 只在admin数据库中可用,赋予用户所有分片和复制集相关函数的管理权限
readAnyDatabase 只在admin数据库中可用,赋予用户所有数据库的读权限
readWriteAnyDatabase 只在admin数据库中可用,赋予用户所有数据库的读写权限
userWriteAnyDatabase 只在admin数据库中可用,赋予用户所有数据库的userAdmin权限
dbAdminAnyDatabase 只在admin数据库中可用,赋予用户所有数据库的dbAdmin权限
root 只在admin数据库中可用,超级管理员

为复制集集群添加权限认证

复制集我们这里采用keyfile文件实现权限认证,并且副本集中的所有成员使用的keyfile必须一样

添加安全认证配置

三台实例必须都要配置

cat>>/usr/local/mongodb/27017/conf/mongod.conf<<EOF

security:authorization:enabledclusterAuthMode:keyFilekeyFile:/usr/local/mongodb/27017/conf/keyfilejavaEnabled:trueEOF

cat>>/usr/local/mongodb/27018/conf/mongod.conf<<EOF

security:authorization:enabledclusterAuthMode:keyFilekeyFile:/usr/local/mongodb/27018/conf/keyfilejavaEnabled:trueEOF

cat>>/usr/local/mongodb/27019/conf/mongod.conf<<EOF

security:authorization:enabledclusterAuthMode:keyFilekeyFile:/usr/local/mongodb/27019/conf/keyfilejavaEnabled:trueEOF

keyfile文件操作

1)生产keyfile文件

opensslrand-base6490>./keyfile

2)复制keyfile文件到其它实例中

#!/bin/bashforiin270172701827019docp/home/mongod/keyfile/usr/local/mongodb/$i/conf/done

3)修改keyfile权限keyfile文件权限必须为X00,不能给group和other成员分配任何权限,否则实例无法启动

#!/bin/bashforiin270172701827019dochmod400/usr/local/mongodb/$i/conf/keyfiledone

4)重启所有实例

#!/bin/bashforiin270172701827019do/usr/local/mongodb/bin/mongod--shutdown-f/usr/local/mongodb/$i/conf/mongod.confsleep3s/usr/local/mongodb/bin/mongod-f/usr/local/mongodb/$i/conf/mongod.confdone

认证验证

登录验证可以在连接的时候指定用户名和密码,也可以先连接到数据库后再进行认证

1)登录指定用户密码

/usr/local/mongodb/bin/mongo--host10.211.55.12--port27018--usernameabcops-p123456abcops_repl:PRIMARY>showdbsabcops0.000GBadmin0.000GBconfig0.000GBlocal0.000GB

2)先登录,后验证

abcops_repl:PRIMARY>useadmin#必须要先切换到admin库中才可以进行进行验证switchedtodbadminabcops_repl:PRIMARY>db.auth('abcops','123456')#认证用户名及密码,认证成功返回1,否则返回01abcops_repl:PRIMARY>showdbsabcops0.000GBadmin0.000GBconfig0.000GBlocal0.000GBabcops_repl:PRIMARY>dbadmin

3)在备库进行验证备库只能进行查询,勿要在备库上进行任何操作

/usr/local/mongodb/bin/mongo--host10.211.55.12--port27017

abcops_repl:SECONDARY>rs.slaveOkabcops_repl:SECONDARY>useadminswitchedtodbadminabcops_repl:SECONDARY>db.auth('abcops','123456')1

客户端验证

我们可以找一台SQL管理工具来连接该库

可以看到我创建的abcops库和一个文档及三个字段


关于我们 | 联系方式 | 招聘信息 | 版权申明 | 广告服务 | 联系我们 |

免责声明:本站为非营利性网站,部分图片或文章来源于互联网如果无意中对您的权益构成了侵犯,我们深表歉意,请您联系,我们立即删除