What does Recilience exactly means in System Building

引入:在大量的论文中,都讨论了系统构建的韧性(Service Resilience)。感觉不是很能理解韧性的含义,感觉有点像容错性,但是又不完全是fault-tolerance,所以进行了调研。

  • Service Resilience的含义

    Service Resilience是指当服务的运行环境出了问题,例如网络故障、服务过载或微服务宕机的情况下,程序仍然能够提供部分或者大部分服务,这时我们就说服务的韧性very good。Serive Resilience在微服务体系中非常重要,它通过提高服务的韧性来弥补环境上的不足。

  • Service Resilience具体方法

    具体而言,通过服务超时timeout、服务重试retry、服务限流rate limiting、熔断器circuit breaker、故障注入fault injection、舱壁隔离技术bulkhead

简而言之,resilience可以理解为:当出现一些干扰性事件时,系统保持其关键服务继续正常运行的可能性。

参考