ServMon的原理是用shell脚本定时抓取被监控Linux服务器上的信息,再用curl POST到监控机的PHP接口程序上,由PHP接口程序对信息进行分析,如果存在异常,则发送报警邮件给管理员。报警邮件演示页面请见:http://blog.s135.com/read.php/276.htm

点击在新窗口中浏览此图片

本日志由 flyinweb 于 2009-07-04 09:32:30 发表到 Linux 中,目前已经被浏览 349 次,评论 0 次;

作者添加了以下标签: Linux监控

首页只显示了部分日志内容,要查看日志的全部内容请阅读全文

  这两天搭建了一组Apache服务器,每台服务器4G内存,采用的是prefork模式,一开始设置的连接数太少了,需要较长的时间去响应用户的请求,后来修改了一下Apache 2.0.59的配置文件httpd.conf:

  1. # prefork MPM  
  2. # StartServers: number of server processes to start  
  3. # MinSpareServers: minimum number of server processes which are kept spare  
  4. # MaxSpareServers: maximum number of server processes which are kept spare  
  5. # MaxClients: maximum number of server processes allowed to start  
  6. # MaxRequestsPerChild: maximum number of requests a server process serves  
  7.  
  8. StartServers         10  
  9. MinSpareServers      10  
  10. MaxSpareServers      15  
  11. ServerLimit          2000  
  12. MaxClients           2000  
  13. MaxRequestsPerChild  10000 


  查看httpd进程数(即prefork模式下Apache能够处理的并发请求数):
  Linux命令:

  1. ps -ef | grep httpd | wc -l 


  返回结果示例:
  1388
  表示Apache能够处理1388个并发请求,这个值Apache可根据负载情况自动调整,我这组服务器中每台的峰值曾达到过2002。



  查看Apache的并发请求数及其TCP连接状态:
  Linux命令:

  1. netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}' 


  (这条语句是从 新浪互动社区事业部技术总监王老大那儿获得的,非常不错)
  返回结果示例:
  LAST_ACK 5
  SYN_RECV 30
  ESTABLISHED 1597
  FIN_WAIT1 51
  FIN_WAIT2 504
  TIME_WAIT 1057
  其中的SYN_RECV表示正在等待处理的请求数;ESTABLISHED表示正常数据传输状态;TIME_WAIT表示处理完毕,等待超时结束的请求数。



  关于TCP状态的变迁,可以从下图形象地看出:
点击在新窗口中浏览此图片
  状态:描述
  CLOSED:无连接是活动的或正在进行
  LISTEN:服务器在等待进入呼叫
  SYN_RECV:一个连接请求已经到达,等待确认
  SYN_SENT:应用已经开始,打开一个连接
  ESTABLISHED:正常数据传输状态
  FIN_WAIT1:应用说它已经完成
  FIN_WAIT2:另一边已同意释放
  ITMED_WAIT:等待所有分组死掉
  CLOSING:两边同时尝试关闭
  TIME_WAIT:另一边已初始化一个释放
  LAST_ACK:等待所有分组死掉

减少TCP连接中的TIME-WAIT

sockets[原创]
  新增的一组Apache服务器上线以来,我用netstat -an命令发现服务器中有大量状态为TIME-WAIT的TCP连接,于是用/sbin/sysctl -a查看了一下Linux的各项内核参数,并翻阅有关资料,决定修改其中的两项参数,以达到减少TCP连接中TIME-WAIT sockets的目的。

vi /etc/sysctl.conf
  编辑/etc/sysctl.conf文件,增加三行:

  1. net.ipv4.tcp_syncookies = 1  
  2. net.ipv4.tcp_tw_reuse = 1  
  3. net.ipv4.tcp_tw_recycle = 1 

  说明:
  net.ipv4.tcp_syncookies = 1 表示开启SYN Cookies。当出现SYN等待队列溢出时,启用cookies来处理,可防范少量SYN攻击,默认为0,表示关闭;
  net.ipv4.tcp_tw_reuse = 1 表示开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭;
  net.ipv4.tcp_tw_recycle = 1 表示开启TCP连接中TIME-WAIT sockets的快速回收,默认为0,表示关闭。

  再执行以下命令,让修改结果立即生效:

  1. /sbin/sysctl -p 


  用以下语句看了一下服务器的TCP状态:

  1. netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}' 


  返回结果如下:
  ESTABLISHED 1423
  FIN_WAIT1 1
  FIN_WAIT2 262
  SYN_SENT 1
  TIME_WAIT 962

  效果:处于TIME_WAIT状态的sockets从原来的10000多减少到1000左右。处于SYN_RECV等待处理状态的sockets为0,原来的为50~300。减少Linux服务器TIME_WAIT过多问题

在Squid服务器中可输入如下命令:
#netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'

LAST_ACK 14
SYN_RECV 348
ESTABLISHED 70
FIN_WAIT1 229
FIN_WAIT2 30
CLOSING 33
TIME_WAIT 18122

状态:描述
CLOSED:无连接是活动的或正在进行
LISTEN:服务器在等待进入呼叫
SYN_RECV:一个连接请求已经到达,等待确认
SYN_SENT:应用已经开始,打开一个连接
ESTABLISHED:正常数据传输状态
FIN_WAIT1:应用说它已经完成
FIN_WAIT2:另一边已同意释放
ITMED_WAIT:等待所有分组死掉
CLOSING:两边同时尝试关闭
TIME_WAIT:另一边已初始化一个释放
LAST_ACK:等待所有分组死掉

也就是说,这条命令可以把当前系统的网络连接状态分类汇总。

下面解释一下为啥要这样写:

一个简单的管道符连接了netstat和awk命令。

——————————————————————

先来看看netstat:

netstat -n

Active Internet connections (w/o servers)
Proto Recv-Q Send-Q Local Address Foreign Address State
tcp 0 0 123.123.123.123:80 234.234.234.234:12345 TIME_WAIT

你实际执行这条命令的时候,可能会得到成千上万条类似上面的记录,不过我们就拿其中的一条就足够了。

——————————————————————

再来看看awk:

/^tcp/
滤出tcp开头的记录,屏蔽udp, socket等无关记录。

state[]
相当于定义了一个名叫state的数组

NF
表示记录的字段数,如上所示的记录,NF等于6

$NF
表示某个字段的值,如上所示的记录,$NF也就是$6,表示第6个字段的值,也就是TIME_WAIT

state[$NF]
表示数组元素的值,如上所示的记录,就是state[TIME_WAIT]状态的连接数

++state[$NF]
表示把某个数加一,如上所示的记录,就是把state[TIME_WAIT]状态的连接数加一

END
表示在最后阶段要执行的命令

for(key in state)
遍历数组

print key,”\t”,state[key]
打印数组的键和值,中间用\t制表符分割,美化一下。

如发现系统存在大量TIME_WAIT状态的连接,通过调整内核参数解决,
vim /etc/sysctl.conf
编辑文件,加入以下内容:
net.ipv4.tcp_syncookies = 1
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_tw_recycle = 1
net.ipv4.tcp_fin_timeout = 30
然后执行 /sbin/sysctl -p 让参数生效。

TIME_WAIT状态的意义:

客户端与服务器端建立TCP/IP连接后关闭SOCKET后,服务器端连接的端口
状态为TIME_WAIT

是不是所有执行主动关闭的socket都会进入TIME_WAIT状态呢?
有没有什么情况使主动关闭的socket直接进入CLOSED状态呢?

主动关闭的一方在发送最后一个 ack 后
就会进入 TIME_WAIT 状态 停留2MSL(max segment lifetime)时间
这个是TCP/IP必不可少的,也就是“解决”不了的。

也就是TCP/IP设计者本来是这么设计的
主要有两个原因
1。防止上一次连接中的包,迷路后重新出现,影响新连接
(经过2MSL,上一次连接中所有的重复包都会消失)
2。可靠的关闭TCP连接
在主动关闭方发送的最后一个 ack(fin) ,有可能丢失,这时被动方会重新发
fin, 如果这时主动方处于 CLOSED 状态 ,就会响应 rst 而不是 ack。所以
主动方要处于 TIME_WAIT 状态,而不能是 CLOSED 。

TIME_WAIT 并不会占用很大资源的,除非受到攻击。

Linux下高并发的Squid服务器,TCP TIME_WAIT套接字数量经常达到两、三万,服务器很容易被拖死。通过修改Linux内核参数,可以减少Squid服务器的TIME_WAIT套接字数量。
  vi /etc/sysctl.conf

  增加以下几行:引用
net.ipv4.tcp_fin_timeout = 30
net.ipv4.tcp_keepalive_time = 1200
net.ipv4.tcp_syncookies = 1
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_tw_recycle = 1
net.ipv4.ip_local_port_range = 1024 65000
net.ipv4.tcp_max_syn_backlog = 8192
net.ipv4.tcp_max_tw_buckets = 5000


  说明:
  net.ipv4.tcp_syncookies = 1 表示开启SYN Cookies。当出现SYN等待队列溢出时,启用cookies来处理,可防范少量SYN攻击,默认为0,表示关闭;
  net.ipv4.tcp_tw_reuse = 1 表示开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭;
  net.ipv4.tcp_tw_recycle = 1 表示开启TCP连接中TIME-WAIT sockets的快速回收,默认为0,表示关闭。
  net.ipv4.tcp_fin_timeout = 30 表示如果套接字由本端要求关闭,这个参数决定了它保持在FIN-WAIT-2状态的时间。
  net.ipv4.tcp_keepalive_time = 1200 表示当keepalive起用的时候,TCP发送keepalive消息的频度。缺省是2小时,改为20分钟。
  net.ipv4.ip_local_port_range = 1024 65000 表示用于向外连接的端口范围。缺省情况下很小:32768到61000,改为1024到65000。
  net.ipv4.tcp_max_syn_backlog = 8192 表示SYN队列的长度,默认为1024,加大队列长度为8192,可以容纳更多等待连接的网络连接数。
  net.ipv4.tcp_max_tw_buckets = 5000表示系统同时保持TIME_WAIT套接字的最大数量,如果超过这个数字,TIME_WAIT套接字将立刻被清除并打印警告信息。默认为180000,改为5000。对于Apache、Nginx等服务器,上几行的参数可以很好地减少TIME_WAIT套接字数量,但是对于Squid,效果却不大。此项参数可以控制TIME_WAIT套接字的最大数量,避免Squid服务器被大量的TIME_WAIT套接字拖死。

  执行以下命令使配置生效:
/sbin/sysctl -p

本日志由 flyinweb 于 2009-07-04 08:57:12 发表到 Linux 中,目前已经被浏览 557 次,评论 0 次;

作者添加了以下标签: ApacheTCP连接状态

  1、如果未安装Apache。编译时,加上--enable-deflate,例如:(仅针对Linux版,Windows版无须此步骤)

  1. ./configure --prefix=/usr/local/apache --enable-rewrite --enable-so --enable-deflate 


  2、如果已安装Apache。添加mod_deflate模块,例如:(仅针对Linux版,Windows版无须此步骤)

  1.   /usr/local/apache/bin/apxs -i -a -c /home/zhangyan/software/httpd-2.0.59/modules/filters/mod_deflate.c 

  注:/home/zhangyan/software/httpd-2.0.59/为Apache源码路径。

  3、进行以上步骤后,会在httpd.conf中自动加入一行:(Windows版请将下行最前面的#号去掉)

  1. LoadModule deflate_module     modules/mod_deflate.so 


  4、编辑httpd.conf,增加:
  Linux版:

  1. <ifmodule mod_deflate.c> 
  2. DeflateCompressionLevel 9  
  3. SetOutputFilter DEFLATE  
  4. #DeflateFilterNote Input instream  
  5. #DeflateFilterNote Output outstream  
  6. #DeflateFilterNote Ratio ratio  
  7. #LogFormat '"%r" %{outstream}n/%{instream}n (%{ratio}n%%)' deflate  
  8. #CustomLog logs/deflate_log.log deflate  
  9. </ifmodule> 
  Windows版:
  1. <ifmodule deflate_module> 
  2. DeflateCompressionLevel 9  
  3. SetOutputFilter DEFLATE  
  4. #DeflateFilterNote Input instream  
  5. #DeflateFilterNote Output outstream  
  6. #DeflateFilterNote Ratio ratio  
  7. #LogFormat '"%r" %{outstream}n/%{instream}n (%{ratio}n%%)' deflate  
  8. #CustomLog logs/deflate_log.log deflate  
  9. </ifmodule> 
  如果将#号去掉,可以在logs/deflate_log.log日志文件中看到文件压缩前后的字节数、压缩比,例如:
  "GET /index.html HTTP/1.1" 49373/276249 (17%)
  压缩前的字节数为276249,压缩后的字节数为49373,压缩比为17%

  5、详细配置见Apache官方网站:http://httpd.apache.org/docs/2.0/mod/mod_deflate.html

  [文章作者:张宴 本文版本:v1.0 最后修改:2007.09.10 转载请注明出处:http://blog.s135.com]

本日志由 flyinweb 于 2009-07-04 08:54:20 发表到 WEB服务器 中,目前已经被浏览 248 次,评论 0 次;

作者添加了以下标签: Apachemod_deflat

www.s135.com 和 blog.s135.com 域名均指向 Nginx 所在的服务器IP。

  用户访问http://www.s135.com,将其负载均衡到192.168.1.2:80、192.168.1.3:80、192.168.1.4:80、192.168.1.5:80四台服务器。

  用户访问http://blog.s135.com,将其负载均衡到192.168.1.7服务器的8080、8081、8082端口。

本日志由 flyinweb 于 2009-07-04 08:46:41 发表到 Linux 中,目前已经被浏览 238 次,评论 0 次;

作者添加了以下标签: Nginx负载均衡

首页只显示了部分日志内容,要查看日志的全部内容请阅读全文

  在生产应用中,某台“Nginx+PHP+MySQL”接口数据服务器,扮演的角色十分重要,如果服务器硬件或Nginx、MySQL发生故障,而短时间内无法恢复,后果将非常严重。为了避免单点故障,我设计了此套方案,编写了failover.sh脚本,实现了双机互备、全自动切换,故障转移时间只需几十秒。

本日志由 flyinweb 于 2009-07-04 08:11:13 发表到 Linux 中,目前已经被浏览 243 次,评论 0 次;

作者添加了以下标签: LinuxNginxPHPMySQL架构

首页只显示了部分日志内容,要查看日志的全部内容请阅读全文


  前言:本文是我撰写的关于搭建“Nginx + PHP(FastCGI)”Web服务器的第5篇文章。本系列文章作为国内最早详细介绍 Nginx + PHP 安装、配置、使用的资料之一,为推动 Nginx 在国内的发展产生了积极的作用。这是一篇关于Nginx 0.7.x系列版本的文章,安装、配置方式与第4篇文章相差不大,但增加了MySQL安装配置的信息、PHP 5.2.10 的 php-fpm 补丁。Nginx 0.7.x系列版本虽然为开发版,但在很多大型网站的生产环境中已经使用。

本日志由 flyinweb 于 2009-07-04 07:28:55 发表到 Linux 中,目前已经被浏览 811 次,评论 0 次;

作者添加了以下标签: linux性能调优NginxPHP

首页只显示了部分日志内容,要查看日志的全部内容请阅读全文

  操作系统:Linux

  安装及配置eaccelerator-0.9.5加速PHP-5.2.1

本日志由 flyinweb 于 2009-07-04 07:09:11 发表到 WEB应用开发 中,目前已经被浏览 264 次,评论 0 次;

作者添加了以下标签: phpeacceleratorZend

首页只显示了部分日志内容,要查看日志的全部内容请阅读全文