LVS类型及工作原理

lvs工作原理

lvs(Linux Virtual Server),工作于layer4,其原理是根据请求报文的目标IP和PORT将其转发至后端主机集群中的某一提供服务的主机,具体转发到哪一台后端主机需要由挑选算法来决定。通俗来说,lvs的功能是通过在内核空间的netfilter上的INPUT链上的ipvs实现的,当报文由物理网络接口进入主机后,ipvs将流经至INPUT链即将进入用户空间的报文强行改变其流向,即PREROUTING-->INPUT-->POSTROUTING

lvs.png

lvs的架构

  • 调度器:director,dispatcher,balancer

  • RS:Real Server

  • CIP:Client IP

  • VIP:Director Virtual IP

  • DIP:Director IP

  • RIP:Real server IP

lvs type

lvs-nat(MASQUERADE)

lvs-nat2.png

实现过程

当客户端发出的请求报文经Director的VIP所在的物理网卡流入主机的内核空间时,报文的源IP是CIP,目标IP是VIP。此时,ipvs将强行改变报文的流经方向,即修改报文的目标IP并经DIP所在的物理网卡调度至后端的Real Server,此时,报文的源IP是CIP,而目标IP是RIP。后端RS接收报文并处理后,构建响应报文(源IP是RIP,目标IP是CIP)将经DIP发送至Director,此时,ipvs将修改报文的源IP为VIP,并经VIP所在的物理网卡发送给客户端。

功能实现的本质

多目标的DNAT(iptables),它通过修改请求报文的目标IP地址(同时可能会修改目标端口实现端口映射) 至挑选出某RS的RIP地址实现转发。

特性

  • RIP和DIP应该使用私网地址,且RS的网关要指向DIP;

  • 请求和相应报文都要经由director转发,极高负载的场景中,director可能会成为系统瓶颈;

  • 支持端口映射;

  • RS可以使用任意OS;

  • RIP和DIP必须在同一物理网络。

lvs-dr(GATEWAY)

lvs-dr2.png

几个理解要点

  • Director和RS只需要一块物理网卡;

  • Director和RS连接至同一台交换机;

  • 每台RS均配置有VIP,并且配置在lo的别名上,如,lo:0

  • 由于RS均有VIP,在路由器进行广播时,为了避免都进行相应,需进行设定,有三种方案

    • 静态绑定:在交换机的配置文件直接进行指定

    • arptables:通过arptables进行设置

    • 修改RS主机内核参数

实现过程

客户端发出的请求报文经过层层路由,到达服务器所在网络的路由器(此时报文的源IP是CIP,目标IP是VIP)。与路由器相连的交换机此时要进行广播获得Director的mac地址,路由器将报文重新进行封装(源mac是路由器的mac地址,目标mac是Director的MAC地址将),并将报文转发至Director。此时,Director亦要进行广播获得RS的mac地址,并重新将报文进行封装(目标mac是RS的mac地址)转发给交换机,交换机收到报文后根据mac转发给对应的RS。报文到达RS后由物理网卡流入内核空间,并再次经lo进入用户空间。报文处理后,构建响应报文(源IP是VIP,目标IP是CIP)经lo到物理网卡转发至路由器,响应给客户端。

实现本质

通过请求报文目标mac地址进行转发。

特性

  • 保证前端路由器将目标IP为VIP的请求发送给director;

  • RIP可以使用私有地址,也可以使用公网地址;

  • RS跟Director必须处于同一物理网络中;

  • 请求报文经Director调度,但相应报文一定不能经由Director;

  • 不支持端口映射;

  • RS可以是大多数的OS;

  • RS的网关不能指向DIP。

lvs-tun(IPIP)

lvs-tun2.png

实现本质

不修改请求报文的ip首部,而是通过在原有的ip首部之外,再封装一个ip首部。需要考虑的问题是再封装后会超出MTU,而再进行报文切片,但是一般情况下请求报文都比较小,不太可能超出MTU。

特性

  • RIP、VIP和DIP全得是公网地址;

  • RS的网关不能指向DIP;

  • 请求报文必须经由Director调度,但相应报文必须不能经由Director;

  • 不支持端口映射;

  • RS的OS必须支持隧道功能。

lvs-fullnat:

lvs-fullnat2.png

实现本质:

Director同时修改请求报文的源地址和目标地址进行转发。但是在内核中并没有支持此种模式,若要使用需要到官方网站下载补丁包。

实现过程

Director收到报文后, 将源IP(CIP)修改为(DIP),目标地址(VIP)修改为(RIP),然后经过层层路由,转发给RIP,。当RS主机收到报文后,回应时,源IP为RIP,目标IP为VIP.Director收到报文后,将源IP修改为自己(VIP), 目标IP修改为CIP。此模型适用与多机房且机房不位于同一地区。

特性

  • VIP是公网地址,RIP和DIP是私网地址,且二者无需在同一网络中;

  • RS接收到的请求报文的源地址是DIP,因此要响应给DIP;

  • 请求报文和响应报文都必须经由Director;

  • 支持断就映射机制;

  • RS可以是任意OS。

lvs scheduler

静态方法:仅根据算法本身进行调度。

  • RR:Round Robin,轮调;

  • WRR:Weighted RR,加权轮调;

  • SH:Source Hash,将来自于同一个ip的请求始终调度至同一RS,实现session保持的机制;

  • DH:Destination Hash,将对同一个目标的请求始终发往同一个RS;

动态方法:根据算法及各RS的当前负载(overhead)状态进行调度。

  • LC:Least Connection,overhead=Active*256+Inactive;

  • WLC:Weighted LC,overhead=(Active*256+Inactive)/weight;

  • SED:Shortest Expection Delay,overhead=(Active+1)*256/weight

  • NQ:Never Queue,SED算法的改进;

  • LBLC:Locality-Based LC,正向代理情况下的cache server调度;

  • LBLCR:Locality-Based Least-Connection with Replication,带复制功能的LBLC算法。

ipvsadm工具的使用

管理集群服务

ipvsadm -A|E -t|u|f service-address [-s scheduler]
ipvsadm -D -t|u|f service-address
    service-address(VIP):
        tcp: -t ip:port
        udp: -u ip:port
        fwm: -f mark
    -s scheduler:
        默认为wlc

管理集群服务中的RS

ipvsadm -a|e -t|u|f service-address -r server-address [-g|i|m] [-w weight]
ipvsadm -d -t|u|f service-address -r server-address
    server-address(RIP):
        ip[:port]
    lvs-type:
        -g: gateway,dr
        -i: ipip,tun
        -m: masquerade,nat

查看和清空

ipvsadm -C
ipvsadm -L|l [options]
    -n: numeric,基于数字 格式显示地址和端口
    -c:connection,显示ipvs连接;
    --stats:显示统计数据;
    --rate:显示速率;
    --exact:显示精确值。

保存和重载–> /etc/sysconfig/ipvsadm

ipvsadm -R --> ipvsadm--restore
ipvsadm -S --> ipvsadm--save

置零计数器

ipvsadm -Z [-t|u|f service-address]

原创文章,作者:Jeason,如若转载,请注明出处:http://www.178linux.com/62278

(0)
JeasonJeason
上一篇 2016-12-05 17:05
下一篇 2016-12-05 17:05

相关推荐

  • 基于LNMP架构添加Memcached支持,并验证其缓存结果

    一 Memcached简介 Memcached是一个自由开源的,高性能,分布式内存对象缓存系统。它是一种基于内存的key-value存储,用来存储小块的任意数据(字符串、对象)。这些数据可以是数据库调用、API调用或者是页面渲染的结果。 Memcached简洁而强大。它的简洁设计便于快速开发,减轻开发难度,解决了大数据量缓存的很多问题。它的API兼容大部分流…

    Linux干货 2016-12-12
  • 第八周

    1、请描述网桥、集线器、二层交换机、三层交换机、路由器的功能、使用场景与区别。 网桥(Bridge)是早期的两端口二层网络设备,用来连接不同网段。网桥的两个端口分别有一条独立的交换信道,不是共享一条背板总线,可隔离冲突域。网桥比集线器(Hub)性能更好,集线器上各端口都是共享同一条背板总线的。后来,网桥被具有更多端口、同时也可隔离冲突域的交换机(Switch…

    Linux干货 2016-09-19
  • N22+北京zhangzhangzhang+第四周作业

    1、复制/etc/skel目录为/home/tuser1,要求/home/tuser1及其内部文件的属组和其它用户均没有任何访问权限。 cp -r /etc/skel /home/tuser1    ls -ld /home/tuser1   &nb…

    Linux干货 2016-09-05
  • CentOS6 ELK实现

    1 简介 我们来介绍Centos6.5基于SSL密码认证部署ELK(Elasticsearch 1.4.4+Logstash 1.4.2+kibana3),同时为大家介绍如何集合如上组件来收集日志,本章的日志收集主要为大家介绍SYSTEM日志收集. 集中化日志收集主要应用场景是在同一个窗口临时性或永久性鉴定分析系统,应用等各类日志,对用户提供极大便…

    Linux干货 2017-05-17
  • shell脚本总结

    shell脚本简要总结 脚本调试 bash -n /path/to/some_script检测脚本中的语法错误 bash -x /path/to/some_script调试执行 变量 环境变量 变量声明、赋值:export name=VALUEdeclare -x name=VALUE 变量引用:$name, ${name} 显示所有环境变量: export…

    Linux干货 2016-08-21
  • Homework Week-14 iptables及tcpwraper访问控制

    系统的INPUT和OUTPUT默认策略为DROP; 1、限制本地主机的web服务器在周一不允许访问;新请求的速率不能超过100个每秒;web服务器包含了admin字符串的页面不允许访问;web服务器仅允许响应报文离开本机; iptables -A INPUT -d 192.168.1.101 -p …

    Linux干货 2016-12-05