查询SQL:show status like 'wsrep_cluster%';

 

集群完整性

参数 描述
wsrep_cluster_state_uuid 集群的UUID值,在集群所有节点的值应该是相同的,有不同值的节点,说明其没有连接入集群
我们知道集群内节点是相互同步的,这意味着他们执行完了所有的相同的事务,每个事务由一个uuid来标识,所以所有节点最后执行的uuid应该是一样的
wsrep_cluster_conf_id 集群成员发生变化的数目,正常情况下所有节点上该值是一样的。如果值不同,说明该节点被临时”分区”了。当节点之间网络连接恢复的时候应该会恢复一样的值
对于一个健康的集群,所有节点的集群变化次数应该是一致的,重启数据库算2次(关闭和启动)
如果该值非常大,可能会是由于节点不断的被踢出和加入导致,需要查看
wsrep_cluster_size 集群中的节点数目,如果这个值跟预期的节点数一致,则所有的集群节点已经连接
对于一个健康的集群,所有节点查询出来的集群大小应该是一致的,应该是所有节点的个数
wsrep_cluster_status 集群节点的状态。如果不为”Primary”,说明出现”分区”或是”split-brain”状况,可能的取值为:Primary、Non-Primary、Disconnected

各节点状态

参数 描述
wsrep_ready 节点是否可以提供查询。该值为ON,则说明可以接受SQL负载。如果为Off,则需要检查wsrep_connected
wsrep_connected 节点是否连接到集群,如果该值为Off,且wsrep_ready的值也为Off,则说明该节点没有连接到集群。(可能是wsrep_cluster_address或wsrep_cluster_name等配置错造成的。具体错误需要查看错误日志)
wsrep_local_state_comment galera状态,如果wsrep_connected为On,但wsrep_ready为OFF,则可以从该项查看原因,有如下值:
Joining
Waiting on SST
Joined
Synced (一般应该为Synced,代表已同步)
Donor

复制性能状态

参数 描述
wsrep_local_recv_queue_avg 表示slave事务队列的平均长度,slave瓶颈的预兆
wsrep_flow_control_paused 表示复制停止了多长时间。即表明集群因为Slave延迟而慢的程度,值为0~1,越靠近0越好,值为1表示复制完全停止。可优化wsrep_slave_threads的值来改善
wsrep_cert_deps_distance 有多少事务可以并行应用处理。wsrep_slave_threads设置的值不应该高出该值太多

大量写状态

参数 描述
wsrep_local_send_queue_avg 网络瓶颈的预兆。如果这个值比较高的话,可能存在网络瓶
该值大于0代表,节点无法及时应用接收到的写集
wsrep_local_recv_queue_min 查看节点本地接收队列的最小值
wsrep_local_recv_queue_max 查看节点本地接收队列的最大值

wsrep相关参数含义介绍:

  • wsrep_local_state_uuid:存储于该节点的UUID状态
  • wsrep_protocol_version:wsrep协议使用的版本
  • wsrep_last_committed:最后提交事务的序列号
  • wsrep_replicated:发送到其他节点的writesets总数
  • wsrep_replicated_bytes:发送到其他节点的writesets总字节数
  • wsrep_repl_keys:复制keys总数
  • wsrep_repl_keys_bytes:复制keys总字节数
  • wsrep_repl_data_bytes:复制数据的总字节数
  • wsrep_repl_other_bytes:其他复制的总字节数
  • wsrep_received:从其他节点接收的writesets总数
  • wsrep_received_bytes:从其他节点接收的writesets总字节数
  • wsrep_local_commits:该节点提交的writesets总数
  • wsrep_local_cert_failures:认证测试中失败的writesets总数
  • wsrep_local_replays:因非对称锁粒度回放的事务数
  • wsrep_local_send_queue:当前发送队列的长度,表示等待被发送的writesets数
  • wsrep_local_send_queue_avg:网络瓶颈的预兆。如果这个值比较高的话,可能存在网络瓶
  • wsrep_local_recv_queue:当前接收队列的长度,表示等待被使用的writesets数
  • wsrep_local_recv_queue_avg:表示slave事务队列的平均长度,slave瓶颈的预兆
  • wsrep_local_cached_downto:gcache的最小序列号,这个变量可以用来判断是用IST,还是SST。如果此值为0,表示gcache中没有writesets
  • wsrep_flow_control_paused_ns:表示复制停止了多长时间,以纳秒为单位
  • wsrep_flow_control_paused:表示复制停止了多长时间。即表明集群因为Slave延迟而慢的程度,值为0~1,越靠近0越好,值为1表示复制完全停止。可优化wsrep_slave_threads的值来改善
  • wsrep_flow_control_sent:表示该节点已经停止复制了多少次
  • wsrep_flow_control_recv:表示该节点已经停止复制了多少次
  • wsrep_cert_deps_distance:有多少事务可以并行应用处理。wsrep_slave_threads设置的值不应该高出该值太多
  • wsrep_apply_oooe:并发执行效率,writesets应用于out-of-order的频率
  • wsrep_apply_oool:大序列值的writeset比小序列值的writeset多出的执行频率
  • wsrep_apply_window:同时使用的最高序列值和最小序列值间的平均差值
  • wsrep_commit_oooe:事务脱离队列的频率
  • wsrep_commit_window:同时提交的最大序列值和最小序列值间的平均差值
  • wsrep_local_state:galera状态值
    • 1 – Joining (requesting/receiving State Transfer) –表示此节点正在加入集群
    • 2 – Donor/Desynced –表示正在加入的节点是donor
    • 3 – Joined –表示节点已经加入集群r
    • 4 – Synced –表示节点已经和集群同步
  • wsrep_local_state_comment:galera状态,如果wsrep_connected为On,但wsrep_ready为OFF,则可以从该项查看原因
  • wsrep_cert_index_size:certification索引的entries数量
  • wsrep_cert_bucket_count:哈希表中certification索引的cells数
  • wsrep_gcache_pool_size:page pool或者为gcache动态分配的字节数
  • wsrep_causal_reads:writesets处理数
  • wsrep_incoming_addresses:以逗号分隔显示集群中的节点地址
  • wsrep_evs_repl_latency:提供集群节点间通信复制延迟信息
  • wsrep_evs_delayed:被剔除出集群的UUID
  • wsrep_evs_evict_list:有延迟的节点列表
  • wsrep_evs_state:EVS协议状态
  • wsrep_gcomm_uuid:galera的view_id,不同于集群的uuid,在gvwstate.dat可以查看到
  • wsrep_cluster_conf_id:集群成员发生变化的数目,正常情况下所有节点上该值是一样的。如果值不同,说明该节点被临时”分区”了。当节点之间网络连接恢复的时候应该会恢复一样的值
  • wsrep_cluster_size:集群中的节点数目,如果这个值跟预期的节点数一致,则所有的集群节点已经连接
  • wsrep_cluster_state_uuid:集群的UUID值,在集群所有节点的值应该是相同的,有不同值的节点,说明其没有连接入集群
  • wsrep_cluster_status:集群节点的状态。如果不为”Primary”,说明出现”分区”或是”split-brain”状况,可能的取值为:Primary、Non-Primary、Disconnected
  • wsrep_connected:节点是否连接到集群,如果该值为Off,且wsrep_ready的值也为Off,则说明该节点没有连接到集群。(可能是wsrep_cluster_address或wsrep_cluster_name等配置错造成的。具体错误需要查看错误日志)
  • wsrep_local_bf_aborts:被其他节点上的事务终止的正在执行的本地事务数
  • wsrep_local_index:集群节点索引
  • wsrep_provider_name:wsrep程序提供者
  • wsrep_provider_vendor:wsrep供应商
  • wsrep_provider_version:wsrep程序提供者的版本
  • wsrep_ready:节点是否可以提供查询。该值为ON,则说明可以接受SQL负载。如果为Off,则需要检查wsrep_connected

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。