高可用(HA)是分布式系统架构设计中必须考虑的因素之一,它通常是指,通过设计减少系统不能提供服务的时间。而服务器的可用性是指单位时间内(通常一年),服务器可以正常工作的时间比例。
假设系统一直能够提供服务,我们说系统的可用性是100%。
如果系统每运行100个时间单位,会有1个时间单位无法提供服务,我们说系统的可用性是99%。
很多公司的高可用目标是4个9,也就是99.99%,这就意味着,系统的年停机时间为8.76个小时。
百度的搜索首页,是业内公认高可用保障非常出色的系统,甚至人们会通过http://www.bAIdu.com 能不能访问来判断“网络的连通性”,百度高可用的服务让人留下啦“网络通畅,百度就能访问”,“百度打不开,应该是网络连不上”的印象,这其实是对百度HA最高的褒奖。
想要实现高可用就要避免使用单点,你想想看你的单台服务器再强应用优化得再极致,只要它宕机,就都凉凉了,所以需要多台机器也就是需要集群,方法论中叫冗余。如果有冗余备份,宕机了还有其他backup能够顶上,才可能实现高可用。只是有了集群是不能完全满足复杂业务的高可用的,目前业内已经有越来越多的运维人员采用高可用集群软件去保障系统的高可用性。
在高可用集群朝多样化、易操作维护等方向迅速发展的今天,市场上的高可用集群软件产品品种繁多,但对于任何一款高可用集群产品,故障监视都是最核心的功能。监视资源种类的多少和监视层次的深浅,都成为评价一款集群软件高可用性的重要指标。
免责声明:本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,我们将根据您提供的证明材料确认版权并立即删除内容。