使用nginx进行负载均衡
我租了三台3A的服务器,使用的时候刚好用到了负载均衡,顺便分享给你们,如果有需要服务器或者哪里不懂的,可以私信我
1. nginx负载均衡介绍
nginx应用场景之一就是负载均衡。在访问量较多的时候,可以通过负载均衡,将多个请求分摊到多台服务器上,相当于把一台服务器需要承担的负载量交给多台服务器处理,进而提高系统的吞吐率;另外如果其中某一台服务器挂掉,其他服务器还可以正常提供服务,以此来提高系统的可伸缩性与可靠性。
2. nginx负载均衡策略
以下截图为nginx官网文档
最少连接
请求分配给活动连接数最少的服务器,哪台服务器连接数最少,则把请求交给哪台服务器,由nginx统计服务器连接数
ip hash
基于客户端ip的分配方式
2.1轮询
以循环方式分发对应用服务器的请求,将请求平均分发到每台服务器上。
2.1.1普通轮询方式
该方式是默认方式,轮询适合服务器配置相当,无状态且短平快的服务使用。另外在轮询中,如果服务器挂掉,会自动剔除该服务器。
<di> <di> <di> <di> <di> <di> <di> <di> <di> <di> <di> <di> <di> <di>http {
</di></di></di></di></di></di></di></di></di></di></di></di></di></di>}
2.1.2权重轮询方式
如果在upstream中配置的server参数后追加weight配置,则会根据配置的权重进行请求分发。此策略可以与least_conn和ip_hash结合使用,适合服务器的硬件配置差别比较大的情况。
#定义转发分配规则
<di> <di> <di>upstream myapp1 {
</di></di></di>}
2.2最少连接
轮询算法是把请求平均的转发给各个后端,使它们的负载大致相同;但是,有些请求占用的时间很长,会导致其所在的后端负载较高。这种情况下,least_conn这种方式就可以达到更好的负载均衡效果,适合请求处理时间长短不一造成服务器过载的情况。
#定义转发分配规则
<di> <di> <di> <di>upstream myapp1 {
</di></di></di></di>}
2.3 ip hash
这个方法确保了相同的客户端的请求一直发送到相同的服务器,这样每个访客都固定访问一个后端服务器。如用户需要分片上传文件到服务器下,然后再由服务器将分片合并,这时如果用户的请求到达了不同的服务器,那么分片将存储于不同的服务器目录中,导致无法将分片合并,该场景则需要使用ip hash策略。
需要注意的是,ip_hash不能与backup同时使用,另外当有服务器需要剔除,必须手动down掉,此模式适合有状态服务,比如session。
#定义转发分配规则
<di> <di> <di> <di>upstream myapp1 {
</di></di></di></di>}
3. nginx负载均衡搭建示例
该示例使用一台nginx作为负载均衡服务器,两台tomcat作为web服务器;可以把三个服务均在一台机器进行搭建,也可以使用虚拟机虚拟三台机器,然后进行测试。教程这里就只在一台机器进行搭建,采用默认的权重方式进行配置。
3.1 tomcat配置
将两台tomcat解压出来,配置完毕相应的端口,然后在webapps目录下创建test目录,然后在test目录中创建index.html文件,随便写入一些内容,两台tomcat中test目录下的index.html文件内容要区分开来,例如写入1111111 / 222222222,如下图所示。
3.2 nginx配置
首先进行nginx的安装,安装教程可以参考我之前的文章
安装完毕后,进入nginx目录下的conf目录,编辑nginx.conf文件,修改内容为在http节点下增加
upstream tomcat { #该部分内容与server节点同级
server tomcat服务的ip:tomcat服务的端口号;
server tomcat服务的ip:tomcat服务的端口号;
}
server节点下的location /节点中,把默认的
<di> <di>location / {
</di></di>}
修改为
<di>location / {
</di>}
然后启动两台tomcat与nginx服务,在浏览器输入nginx服务的地址:端口,不停刷新页面,就可以看到每次请求的服务器发生了改变。