反向代理负载均衡
使用代理服务器可以将请求转发给内部的Web服务器,使用这种加速模式显然可以提升静态网页的访问速度。因此也可以考虑使用这种技术,让代理服务器将请求均匀转发给多台内部Web服务器之一上,从而达到负载均衡的目的。 这种代理方式与普通的代理方式有所不同,标准代理方式是客户使用代理访问多个客户使用它访问内部Web服务器,因此也被称为反向代理模式。
1、概念
实现这个反向代理能力并不能算是一个特别复杂的任务,但是在负载均衡中要求特别高的效率,这样实现起来就不是十分简单的了。 每针对一次代理,代理服务器就 必须打开两个连接,一个为对外的连接,一个为对内的连接,因此对于连接请求数量非常大的时候,代理服务器的负载也就非常之大了,在最后反向代理服务器会成 为服务的瓶颈。例如,使用Apache的mod_rproxy模块来实现负载均衡功能时,提供的并发连接数量受Apache本身的并发连接数量的限制。一 般来讲,可以使用它来对连接数量不是特别大,但每次连接都需要消耗大量处理资源的站点进行负载均衡,例如搜寻。
使 用反向代理的好处是,可以将负载均衡和代理服务器的高速缓存技术结合在一起,提供有益的性能,具备额外的安全性,外部客户不能直接访问真实的服务器。并且 实现起来可以实现较好的负载均衡策略,将负载可以非常均衡的分给内部服务器,不会出现负载集中到某个服务器的偶然现象。
2、nginx(侦听8080端口)和apache(侦听80端口)。在虚拟的Linux系统上安装apache(侦听80端口)。这样相当于拥有了1台nginx用来作为反向代理服务器,放置到两台apache之前,作为用户访问的入口;
nginx的目录下;动态的页面和数据库访问都保留到后台的apache服务器上。
c. 如下两种方法实现server cluster的负载均衡。
假设前端 个apache服 务器(分别为localhost:80和158.37.70.143:80),一台根目录放置phpMyAdmin文件夹和 test.php(里面测试代码为print "server1";),另一台根目录仅仅放置一个test.php(里面测试代码为print "server2";)。
2)针对不同请求的负载均衡:
a. 在最简单地构建反向代理的时候( nginx.conf中修改:
location ~ \.php$ {
proxy_pass 158.37.70.143:80;
}
>;这样当客户端访问localhost:8080/index.html的时候,前端的 nginx目录下根本就没有该文件),但是通过上面的设置location ~ \.php$(表示正则表达式匹配以.php结尾的文件,详情参看location是如何定义和匹配的 , nginx,然后 nginx使用memcached模块或者squid还可以支持缓存),输出结果为打印 server2。
如上是最为简单的使用 nginx.conf的server模块部分,将对应部分修改为:
location ^~ /phpMyAdmin/ {
proxy_pass 127.0.0.1:80;
}
location ~ \.php$ {
proxy_pass 158.37.70.143:80;
}
上面第一个部分location ^~ /phpMyAdmin/,表示不使用正则表达式匹配(^~),而是直接匹配,也就是如果客户端访问的URL是以 开头的话(本地的 nginx会自动pass到127.0.0.1:80的Apache服务器,该服务器对phpMyAdmin目录下的页面进行解析,然后将结果发送给 nginx直接进行响应;
>;如果用户访问test.php页面的话,158.37.70.143:80的Apache进行响应;
>;如果用户访问目录phpMyAdmin下的页面的话,127.0.0.1:80的Apache进行响应;
3)访问同一页面的负载均衡:
即用户访问http://localhost:8080/test.php这个同一页面的时候,实现了两台服务器的负载均衡(实际情况中,这两个服务器上的数据要求同步一致,这里我们分别定义了打印server1和server2是为了进行辨认区别)。
a. 现在的情况是在windows下nginx.conf为:
>;首先 在nginx.conf的http模块中添加,服务器集群server cluster(我们这里是两台)的定义:
upstream myCluster{
server 127.0.0.1:80;
server 158.37.70.143:80;
}
表示这个server cluster包含2台服务器
>;然后在server模块中定义,负载均衡:
location ~ \.php$ {
proxy_pass http:// myCluster; # 这里的名字和上面的cluster的名字相同
proxy_redirect off;
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For$proxy_add_x_forwarded_for;
}
这样的话,如果访问 页面的话, ;;
server 158.37.70.143:80 weight=1 max_fails=2 fail_timeout=30s;
}
这样表示5/6的几率访问第一个server,1/6访问第二个。同时还可以定义max_fails和fail_timeout等参数。
====================
综上,通过使用nginx仅仅用来处理静态页面响应和动态请求的代理pass,后台的apache server作为app server来对前台pass过来的动态页面进行处理并返回给nginx和多台apache构成的机群cluster的负载均衡。
两种均衡:
1)可以在nginx中定义访问同一页面,均衡(当然如果服务器性能不同可以定义权重来均衡)地代理到不同的后台server上。如上的例子访问test.php页面,会均衡地代理到server1或者server2上。
实际应用中,server1和server2上分别保留相同的app程序和数据,需要考虑两者的数据同步。
简单总结:
主要通过以下手段实现负载均衡:
location:定义需要匹配的请求(文件或目录,可以使用正则或不使用正则直接匹配)
proxy_pass:定义需要将请求proxy到地方(某台主机或者某个upstream cluser集群)