What does Recilience exactly means in System Building
引入:在大量的论文中,都讨论了系统构建的韧性(Service Resilience)。感觉不是很能理解韧性的含义,感觉有点像容错性,但是又不完全是fault-tolerance,所以进行了调研。
Service Resilience的含义
Service Resilience是指当服务的运行环境出了问题,例如网络故障、服务过载或微服务宕机的情况下,程序仍然能够提供部分或者大部分服务,这时我们就说服务的韧性very good。Serive Resilience在微服务体系中非常重要,它通过提高服务的韧性来弥补环境上的不足。
Service Resilience具体方法
具体而言,通过服务超时timeout、服务重试retry、服务限流rate limiting、熔断器circuit breaker、故障注入fault injection、舱壁隔离技术bulkhead
简而言之,resilience可以理解为:当出现一些干扰性事件时,系统保持其关键服务继续正常运行的可能性。
参考
- https://zhuanlan.zhihu.com/p/81111394
- https://blog.csdn.net/weixin_45882672/article/details/117531867
- https://blog.csdn.net/devopscsdn/article/details/89515885?utm_term=%E8%BD%AF%E4%BB%B6%E7%9A%84resilience&utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2~all~sobaiduweb~default-4-89515885&spm=3001.4430