在本篇博客中我们主要讨论下博客的管理。由于已经在前面五篇中写了详细的实例,因此这里就不再举例说明。 一、监控 分片集群是整个体系中比较复杂的一块,因此更应该需要监控。 主要命令: serverstatus和currentOp() 二、手动分区 手动分区意思就是手动对线
在本篇博客中我们主要讨论下博客的管理。由于已经在前面五篇中写了详细的实例,因此这里就不再举例说明。
一、监控
分片集群是整个体系中比较复杂的一块,因此更应该需要监控。
主要命令: serverstatus和currentOp()
二、手动分区
手动分区意思就是手动对线上分片集群的块进行拆分和迁移。一般而言,一个分片写的越多,它越大。 movechunk命令在这种情况下同样有帮助
三、增加一个分片
sh.addShard("computername:port")
使用这种方式增加容量,要注意向新分片迁移数据所花费的时间。预计迁移速度是每分钟100~200M。最好在索引和工作集达到现有计划添加新分片。
四、删除分片
在一些很少见的情况下,你可能想删除一个分片,可以通过命令removeshard命令进行删除。一旦分片被清空,你还要确认将要删除的分片不是数据库的主分片,可以通过命令config.databases集合进行查询;
db.databases.find()
五、集合去分片
虽然可以删除一个分片,但是没有正式的路径去掉集合的分片。做法就是先用mongodump命令导出数据然后再用mongorestore来恢复数据。
六、备份分片集合
要备份分片集群,就是需要配置数据以及每个分片数据的副本;一种方式是利用monodump命令来导出数据。另一方式就是从每个分片的一个成员里复制数据文件,再从另一台服务器中复制数据文件。
无论那种方式,要确认再备份系统的时候没有块处在移动过程中。
停止均衡器:use config; db.setting.update({_id:"balancer"},{$set:{stopped:true},true})
备份之前重新确认: use config, db.locks.find({"_id":"balancer"})
备份之后别忘了启动均衡器
sh.setBalancerState()
sh.isBalancerRunning()
七、故障转移和恢复
分片成员故障,自动会转移到其他副本集一员。如果有不正常的表现,可以利用重启mongos进行进行重置
配置服务器故障:一个分片集群一般有三台配置服务器,如果有两台发生故障,那么剩余的配置服务器变为只读状态,所有的拆分和均衡操作都会停止。这个对集群的读写没有影响,当三条配置服务器恢复后,均衡器就会它停止的地方那个重新开始工作
mongos故障:如果mongos进程发生故障,一般重启应用服务器;