在生产应用中,某台“Nginx+PHP+MySQL”接口数据服务器,扮演的角色十分重要,如果服务器硬件或Nginx、MySQL发生故障,而短时间内无法恢复,后果将非常严重。为了避免单点故障,我设计了此套方案,编写了failover.sh脚本,实现了双机互备、全自动切换,故障转移时间只需几十秒。


一、双机互备、全自动切换方案:
1、拓扑图:
拓扑图

2、解释:
  (1)、假设外网域名blog.s135.com解析到外网虚拟IP 72.249.146.214上,内网hosts设置db10对应内网虚拟IP 192.168.146.214

  (2)、默认情况下,由主机绑定内、外网虚拟IP,备机作为备份,当主机的MySQL、Nginx或服务器出现故障无法访问时,备机会自动接管内、外网虚拟IP。两台服务器都启动负责监控、自动切换虚拟IP的守护进程/usr/bin/nohup /bin/sh /usr/local/webserver/failover/failover.sh 2>&1 > /dev/null &

  (3)、主机和备机上的MySQL服务器互为主从,互相同步。在主机处于活动状态(即由主机绑定虚拟IP)时,读写主机的MySQL,写到主机的数据会同步到备机;在备机处于活动状态时,读写备机的MySQL,写到备机的数据会同步到主机(如果主机上的MySQL死掉暂时无法同步,主机上的MySQL恢复后,数据会自动从备机上同步过来,反之亦然)。

  (4)、主机处于活动状态时,每20秒会把/data0/htdocs/(网页、程序、图片存放目录)、/usr/local/webserver/php/etc/(php.ini等配置文件目录)、/usr/local/webserver/nginx/conf/(Nginx配置文件目录)三个目录下的文件通过rsync推送到备机服务器上的对应目录(增量推送,两台服务器上一样的文件不会重复推送),反之如果备机处于活动状态时,每20秒会尝试把文件推送到主机。rsync的配置文件见两台服务器的/etc/rsyncd.conf,rsync守护进程的启动命令为rsync --daemon

3、自动切换流程
  (1)、主机默认绑定内、外网虚拟IP,当主机的MySQL、Nginx无法访问或服务器宕机,主机上的failover.sh守护进程会自动摘除自己绑定的内、外网虚拟IP(如果主机上的failover.sh死掉,无法摘除自己绑定的虚拟IP也没关系),备机上的failover.sh守护进程会自动接管备机原来绑定的内、外网虚拟IP,并发送ARPing包给内、外网网关更新MAC,强行接管。

  (2)、备机绑定虚拟IP后,会发送ARPing包给内、外网网关,通知网关更新虚拟IP的MAC地址为备机的MAC地址,从而保证了切换后能够通过虚拟IP及时访问到备机。

  (3)、如果主机的MySQL、Nginx启动起来,全部恢复正常访问,主机上的failover.sh守护进程会检测主机上的MySQL数据是否已经完全从备机上同步过来。如果同步延迟时间为0,主机会自动接管内、外网虚拟IP,并发送ARPing包给内、外网网关,而备机也会自动摘除内、外网虚拟IP。

  (4)、整个切换流程均由failover.sh自动完成,无需人工处理。

4、注意事项(很重要):
  (1)、crontab里的文件没有做自动同步,如果修改,需要手工在两台服务器上都做修改。

  (2)、/data0/htdocs/目录内任何用ln -s建立的软连接,rsync不会自动同步,如果在一台服务器上建了软连接,需要手工在另外一台服务器上也建相同的软连接。

  (3)、如果要删除/data0/htdocs/目录内的某些文件或目录,需要先删除处于活动状态(即绑定了虚拟IP)服务器上的文件或目录,再删除处于备用状态服务器上的文件或目录。

  (4)、除了/data0/htdocs/(网页、程序、图片存放目录)、/usr/local/webserver/php/etc/(php.ini等配置文件目录)、/usr/local/webserver/nginx/conf/(Nginx配置文件目录)三个目录之外的其他配置修改,需要在两台服务器上都做修改。



二、配置文档与脚本:
1、主机、备机两台服务器的rsync配置(配置相同)
  (1)、rsync配置文件

vi /etc/rsyncd.conf


  输入一些内容并保存:

  1. uid = root  
  2. gid = root  
  3. use chroot = no  
  4. max connections = 20  
  5. pid file = /var/run/rsyncd.pid  
  6. lock file = /var/run/rsync.lock  
  7. log file = /var/log/rsyncd.log  
  8.  
  9. [data0_htdocs]  
  10. path = /data0/htdocs/  
  11. ignore errors  
  12. read only = no  
  13. hosts allow = 192.168.146.0/24  
  14. hosts deny = 0.0.0.0/32  
  15.  
  16. [php_etc]  
  17. path = /usr/local/webserver/php/etc/  
  18. ignore errors  
  19. read only = no  
  20. hosts allow = 192.168.146.0/24  
  21. hosts deny = 0.0.0.0/32  
  22.  
  23. [nginx_conf]  
  24. path = /usr/local/webserver/nginx/conf/  
  25. ignore errors  
  26. read only = no  
  27. hosts allow = 192.168.146.0/24  
  28. hosts deny = 0.0.0.0/32 


  (2)、启动rsync守护进程

/usr/bin/rsync --daemon



2、两台MySQL互为主从的配置
  这里就不详细写出互为主从的配置过程了,如果不懂的朋友可以在Google上搜一下。有一点需要指出,my.cnf配置文件中请加上skip-name-resolve参数,使用IP来进行MySQL帐号验证。

3、主机、备机两台服务器负载监控、虚拟IP自动切换的failover.sh守护进程
  (1)、启动failover.sh守护进程(为了开机能够自动运行,请将以下语句添加到/etc/rc.local文件中):

/usr/bin/nohup /bin/sh /usr/local/webserver/failover/failover.sh 2>&1 > /dev/null &



  (2)、停止failover.sh守护进程:

ps -ef | grep failover.sh


  会显示以下信息:
root     15428     1  0 Nov17 ?        00:00:03 /bin/sh /usr/local/webserver/failover/failover.sh
  root     20123  6878  0 16:16 pts/2    00:00:00 grep failover.sh

  然后杀死failover.sh的进程:

kill -9 15428


  (3)、failover.sh代码内容(请注意其中的type设置,主机设为master,备机设为slave):

  1. #!/bin/sh  
  2. LANG=C  
  3. date=$(date -d "today" +"%Y-%m-%d %H:%M:%S")  
  4.  
  5. #---------------配置信息(开始)---------------  
  6. #类型:主机设为master,备机设为slave  
  7. type="master"  
  8.  
  9. #主机、备机切换日志路径  
  10. logfile="/var/log/failover.log"  
  11.  
  12. #MySQL可执行文件地址,例如/usr/local/mysql/bin/mysql;MySQL用户名;密码;端口  
  13. mysql_bin="/usr/local/webserver/mysql/bin/mysql"  
  14. mysql_username="root"  
  15. mysql_password="123456"  
  16. mysql_port="3306"  
  17.  
  18. #内网网关  
  19. gateway_eth0="192.168.146.1"  
  20.  
  21. #主机内网真实IP  
  22. rip_eth0_master="192.168.146.213"  
  23.  
  24. #备机内网真实IP  
  25. rip_eth0_slave="192.168.146.215"  
  26.  
  27. #主机、备机内网共用的虚拟IP  
  28. vip_eth0_share="192.168.113.214"  
  29.  
  30.  
  31. #外网网关  
  32. gateway_eth1="72.249.146.193"  
  33.  
  34. #主机外网真实IP  
  35. rip_eth1_master="72.249.146.213"  
  36.  
  37. #备机外网真实IP  
  38. rip_eth1_slave="72.249.146.215"  
  39.  
  40. #主机、备机外网共用的虚拟IP  
  41. vip_eth1_share="72.249.146.214"  
  42. #---------------配置信息(结束)---------------  
  43.  
  44. #绑定内、外网虚拟IP  
  45. function_bind_vip()  
  46. {  
  47.     /sbin/ifconfig eth0:vip ${vip_eth0_share} broadcast ${vip_eth0_share} netmask 255.255.255.255 up  
  48.     /sbin/route add -host ${vip_eth0_share} dev eth0:vip  
  49.     /sbin/ifconfig eth1:vip ${vip_eth1_share} broadcast ${vip_eth1_share} netmask 255.255.255.255 up  
  50.     /sbin/route add -host ${vip_eth1_share} dev eth1:vip  
  51.     /usr/local/webserver/php/sbin/php-fpm reload  
  52.     kill -USR1 `cat /usr/local/webserver/nginx/logs/nginx.pid`  
  53.     /sbin/service crond start  
  54. }  
  55.  
  56. #解除内、外网虚拟IP  
  57. function_remove_vip()  
  58. {  
  59.     /sbin/ifconfig eth0:vip ${vip_eth0_share} broadcast ${vip_eth0_share} netmask 255.255.255.255 down  
  60.     /sbin/ifconfig eth1:vip ${vip_eth1_share} broadcast ${vip_eth1_share} netmask 255.255.255.255 down  
  61.     /sbin/service crond stop  
  62. }  
  63.  
  64. #主机向备机推送文件的函数  
  65. function_rsync_master_to_slave()  
  66. {  
  67.     /usr/bin/rsync -zrtuog /data0/htdocs/ ${rip_eth0_slave}::data0_htdocs/ > /dev/null 2>&1  
  68.     /usr/bin/rsync -zrtuog /usr/local/webserver/php/etc/ ${rip_eth0_slave}::php_etc/ > /dev/null 2>&1  
  69.     /usr/bin/rsync -zrtuog /usr/local/webserver/nginx/conf/ ${rip_eth0_slave}::nginx_conf/ > /dev/null 2>&1  
  70. }  
  71.  
  72. #备机向主机推送文件的函数  
  73. function_rsync_slave_to_master()  
  74. {  
  75.     /usr/bin/rsync -zrtuog /data0/htdocs/ ${rip_eth0_master}::data0_htdocs/ > /dev/null 2>&1  
  76.     /usr/bin/rsync -zrtuog /usr/local/webserver/php/etc/ ${rip_eth0_master}::php_etc/ > /dev/null 2>&1  
  77.     /usr/bin/rsync -zrtuog /usr/local/webserver/nginx/conf/ ${rip_eth0_master}::nginx_conf/ > /dev/null 2>&1  
  78. }  
  79.  
  80. #虚拟IP ARPing  
  81. function_vip_arping()  
  82. {  
  83.   /sbin/arping -I eth0 -c 3 -s ${vip_eth0_share} ${gateway_eth0} > /dev/null 2>&1  
  84.   /sbin/arping -I eth1 -c 3 -s ${vip_eth1_share} ${gateway_eth1} > /dev/null 2>&1    
  85. }  
  86.  
  87. while true  
  88. do  
  89.     #用HTTP协议检查虚拟IP  
  90.     if (curl -m 30 -G http://${vip_eth1_share}/ > /dev/null 2>&1) && (${mysql_bin} -u"${mysql_username}" -p"${mysql_password}" -P"${mysql_port}" -h"${vip_eth0_share}" -e"show slave status\G" > /dev/null 2>&1)  
  91.     then  
  92.     #取得与内网VIP绑定的服务器内网IP  
  93.     eth0_active_server=$(${mysql_bin} -u"${mysql_username}" -p"${mysql_password}" -P"${mysql_port}" -h"${vip_eth0_share}" -e"show slave status\G" | grep "Master_Host" | awk -F ': ' '{printf $2}')  
  94.       
  95.     #如果内网VIP=主机内网IP(主机MySQL中的Master_Host显示的是备机的域名或IP),且本机为主机  
  96.     if [ "${eth0_active_server}" = "${rip_eth0_slave}" ] && [ "${type}" = "master" ]  
  97.     then  
  98.       function_rsync_master_to_slave  
  99.       function_vip_arping      
  100.     #如果内网VIP=备机内网IP(备机MySQL中的Master_Host显示的是主机的域名或IP)  
  101.     elif [ "${eth0_active_server}" = "${rip_eth0_master}" ]  
  102.     then  
  103.       if (curl -m 30 -G http://${rip_eth1_master}/ > /dev/null 2>&1) && (${mysql_bin} -u"${mysql_username}" -p"${mysql_password}" -P"${mysql_port}" -h"${rip_eth0_master}" -e"show slave status\G" | grep "Seconds_Behind_Master: 0" > /dev/null 2>&1)  
  104.       then  
  105.         #如果主机能够访问,数据库同步无延迟,且本机就是主机,那么由本机绑定虚拟IP  
  106.         if [ "${type}" = "master" ]  
  107.         then  
  108.           #如果本机为主机  
  109.        function_bind_vip  
  110.           function_vip_arping  
  111.           echo "${date} 主机已绑定虚拟IP!(Type:1)" >> ${logfile}  
  112.         else  
  113.           #如果本机为备机  
  114.        function_remove_vip  
  115.           echo "${date} 备机已去除虚拟IP!(Type:2)" >> ${logfile}  
  116.         fi  
  117.       else  
  118.         if [ "${type}" = "slave" ]  
  119.         then  
  120.           #如果本机为备机  
  121.        function_rsync_slave_to_master          
  122.           function_vip_arping  
  123.         fi        
  124.       fi  
  125.     fi  
  126.     else  
  127.         #虚拟IP无法访问时,判断主机能否访问  
  128.         if (curl -m 30 -G http://${rip_eth1_master}/ > /dev/null 2>&1) && (${mysql_bin} -u"${mysql_username}" -p"${mysql_password}" -P"${mysql_port}" -h"${rip_eth0_master}" -e"show slave status\G" > /dev/null 2>&1)  
  129.         then  
  130.             #如果主机能够访问,且本机就是主机,那么由本机绑定虚拟IP  
  131.             if [ "${type}" = "master" ]  
  132.             then  
  133.                 function_bind_vip  
  134.                 function_vip_arping  
  135.                 echo "${date} 主机已绑定虚拟IP!(Type:3)" >> ${logfile}  
  136.             else  
  137.                 function_remove_vip  
  138.                 echo "${date} 备机已去除虚拟IP!(Type:4)" >> ${logfile}  
  139.             fi  
  140.     elif (curl -m 30 -G http://${rip_eth1_slave}/ > /dev/null 2>&1) && (${mysql_bin} -u"${mysql_username}" -p"${mysql_password}" -P"${mysql_port}" -h"${rip_eth0_slave}" -e"show slave status\G" > /dev/null 2>&1)  
  141.         then  
  142.             #如果主机不能访问而备机能够访问,且本机就是备机,那么由备机绑定虚拟IP  
  143.             if [ "${type}" = "slave" ]  
  144.             then  
  145.                 function_bind_vip  
  146.                 function_vip_arping  
  147.                 echo "${date} 备机已绑定虚拟IP!(Type:5)" >> ${logfile}  
  148.             else  
  149.                 function_remove_vip  
  150.                 echo "${date} 主机已去除虚拟IP!(Type:6)" >> ${logfile}  
  151.             fi  
  152.         else  
  153.             echo "${date} 主机、备机全部无法访问!(Type:7)" >> ${logfile}  
  154.         fi  
  155.     fi  
  156.     #每次循环暂停20秒(即间隔20秒检测一次)  
  157.     sleep 20  
  158. done 

  [文章作者:张宴 本文版本:v1.0 最后修改:2008.11.19 转载请注明原文链接:http://blog.s135.com/post/379/]

此文章由 flyinweb 于 2009-07-04 08:19:42 编辑

本日志由 flyinweb 于 2009-07-04 08:11:13 发表,目前已经被浏览 243 次,评论 0 次;

作者添加了以下标签: LinuxNginxPHPMySQL架构

引用通告:http://www.517sou.net/Article/122/Trackback.ashx

评论订阅:http://www.517sou.net/Article/122/Feeds.ashx

相关文章

评论列表

    暂时没有评论
(必填)
(必填,不会被公开)