Broadview Networks Logo
位置: United States
下载全文

Broadview Networks

亮点

  • 基于 SUSE 产品和合作而构建
  • 异地群集和 BROADVIEW NETWORKS 异地冗余体系结构
  • 包含异地故障切换交换机的 BROADVIEW 异地群集扩展

当飓风“桑迪”重创曼哈顿时,Broadview Networks 屡获殊荣的云 VoIP 服务 OfficeSuite Phone 保持了 100% 的运行时间。但该事件凸显了区域性灾难造成服务中断的潜在可能。通过利用 SUSE® 高可用性产品与合作,Broadview 主动创建了一款异地冗余解决方案,该解决方案即使在此类“世纪风暴”事件期间也能提供业务连续性。

 

 

概述

Broadview Networks 的 OfficeSuite® Phone 由其 silhouette 运营商级电信产品提供支持,是一款面向中小型企业的基于云的 VoIP(IP 语音电话)服务。该公司每天向超过 100,000 名企业用户提供 OfficeSuite 服务。此外,它还向 17 家其他 CSP(云服务提供商)授予 silhouette 许可,这些公司总共为额外的近 80,000 名企业用户提供服务。

 

 

挑战

电信服务提供商的一项重要要求是保持高可用性 (HA):最低可接受范围为 99.99%,但优质标准为 99.999%,通常称为“五个 9”。若换算为停机时间,则为每年停机时间少于六分钟。未能达到此高可用性服务目标可能造成重大后果,包括客户不满意和业务流失。

飓风“桑迪”考验了 Broadview Networks 的高可用性,并彰显了其获得竞争优势的方式。2012 年,当巨大的风暴在东海岸肆虐时,曼哈顿的桥梁和隧道要么被封闭,要么被淹没。Broadview Network 位于纽约市的一栋大楼的地下室被水淹没。

然而,在第四层的中央电信办公室,Broadview Networks 却做好了准备。尽管面临着两周内失去商用电力和后续两个月内无可靠电力的情况,但 Broadview 仍凭借现场人员和由柴油发电机供电的电池组保持了 100% 的运行时间。这是一个巨大的成功,但也提升了全国对于异地冗余的重要性的认识 — 如果整个站点因区域性灾难发生故障,应能够将服务切换到地理位置较远的复制站点。接下来发生的事情进一步印证了这一教训。各公司开始提出异地冗余要求,而 他们的保险公司则威胁要增加保险费,甚至拒绝纳入保险范围,除非公司及其服务提供商可以满足此项要求。事态已经十分明确:Broadview Networks 需要实现异地冗余才能增加销售额并全面保障客户的业务连续性。

在很长一段时间内,并不存在可以实现异地群集的可行 Linux 技术。但是,在毁灭性风暴和客户要求将异地群集提升为研发优先事项之际,Broadview Networks 借助 SUSE 实现了异地群集功能。而在此之前,它也是通过 SUSE 实现了高可用性 (HA)。

 

 

这是一项工程创举,可以让电信或任何系统实现异地冗余。您需要部署一项基础技术和一个框架,比如 SUSE Linux Enterprise High Availability Extension 异地群集。其他 Linux 供应商都没有异地群集解决方案。

SUSE 解决方案

基于 SUSE 产品和合作而构建

2010 年,当 Broadview Networks 为成功走向未来更新其软件时,它选择了采用 SUSE Linux Enterprise Server 和 SUSE Linux Enterprise High Availability Extension。“我们评估了多家 Linux 供应商。我们发现,SUSE Linux Enterprise High Availability Extension 是同类最佳产品。”Broadview Networks 技术副总裁 Brett Buckingham 说。

Broadview 将 SUSE Linux Enterprise Server 与 High Availability Extension 嵌入 silhouette 之中,并藉此设置 HA 群集。分布在群集服务器之间的软件组件(其中一些具有主实例和备份实例)可以通过群集资源管理机制从故障中恢复,包括整个服务器的组件出现故障的情况。如 果主实例出现故障,则升级备份实例;对等网络连接到新的主系统;之前的主实例在恢复后变为新备份。这种设置可为每个站点提供 99.999% 的可用性。

在这段开发时期内,SUSE 与 Broadview的关系也得到发展。Broadview 仍是SUSE 的客户,但同时也成为了 SUSE 的原始设备制造商 (OEM) 和开发合作伙伴,为 SUSE 研发部门提供反馈信息,以便创建新型高可用性技术。其成果之一便是随 SUSE Linux Enterprise Server 11 Service Pack 2 推出的 SUSE Linux Enterprise High Availability Extension 异地群集功能。该功能扩展了 SUSE Linux Enterprise High Availability 不限距离的高可用性群集功能,使整个站点在遭遇区域性灾难时可以故障转移至另一站点,从而保护业务连续性和数据完整性。

“这是一项工程创举,可以让电信或任何系统实现异地冗余。您需要部署一项基础技术和一个框架,比如 SUSE Linux Enterprise High Availability Extension 异地群集。”Buckingham 说,“其他 Linux 供应商都没有异地群集解决方案。”

在与 SUSE 支持和工程部门紧密协作的过程中,Broadview Networks 评估了 SUSE 异地群集技术满足自身新要求的能力。在部署试运行期间,SUSE 向 silhouette 使用的 SUSE Linux Enterprise 11 平台提供了 SUSE Linux Enterprise 12 码流功能。该功能现包在 SUSE Linux Enterprise 12 中,并将在 SUSE Linux Enterprise 11 Service Pack 4 中提供。

“我们发挥自己团队的创造力并与 SUSE 通力合作,在设计和测试方面投入了大量精力。”Brett Buckingham 说。

异地群集和 BROADVIEW NETWORKS 异地冗余体系结构

Broadview Networks 将基于silhouette 的主站点和备份异地站点设置在分散的地理区域,以便影响一个站点的灾难不会影响其他站点。这些异地站点采用 SUSE 异地群集、运行 x86-64 硬件,在异地群集中彼此相连,并连接到第三个异地站点中的仲裁节点。(虽然两个站点足以进行手动故障转移,但进行自动故障转移则需要三个站点。)主站点持 续将 silhouette 配置和运行数据复制到异地备份站点。在异地群集中的票据计划的指示下,只有主站点可以随时提供特定服务。当软件检测到主站点出现故障时,它将备份站点升级 为新的主实例并为客户端系统(即对等网络和电话)实施相应机制,以识别和容许更改的 silhouette 位置。(请参见下一页上的图)。

包含异地故障切换交换机的 BROADVIEW 异地群集扩展

Broadview Networks 开发了自定义扩展,包括用于在异地站点之间复制数据库的自定义设计和资源代理、用于将系统文件复制到异地备份站点的技术和一款异地故障转移交换机。尽管 SUSE Linux Enterprise High Availability Extension 异地群集可提供基于原则的故障转移,将工作负载自动和手动转移到受影响的区域之外,但 Broadview 仍然希望增加人工干预的机会。Brett Buckingham 解释说:“如果过早地或出于错误原因进行故障转移,可能会让事情变得更糟。”

借助异地故障转移交换机,Broadview Networks 扩展了 SUSE 异地群集故障转移策略。如果整个站点中存在已察觉的故障,该技术会发出警报并启动计时器。在经过合理的设定时段后,将进行自动故障转移。但是,在理想情况 下,收到警报后,决策者可能召开会议并按照程序脚本验证中断,然后根据证据授权或中止故障转移。此功能还有助于确保合规性,以免自动将敏感数据故障转移至 其他区域。SUSE 将在未来产品版本中实施此功能。

 

 

成果

目前,SUSE Linux Enterprise Server、SUSE Linux Enterprise High Availability Extension 和 SUSE High Availability Extension 异地群集功能已嵌入 silhouette 7(最新正式发布版)中。预计将于 2015 年第一季度部署在Broadview Networks 实验室及公司内部和新试运行的站点中。

异地群集解决方案提供了战略性的业务优势。首先,它超越了典型的可用性和运行时间定义,解决了这些传统测量方法中通常不包含的极端灾难情况。这在区域性灾难中表现得尤为明显,结合使用silhouette 和异地群集可确保为客户实现灾难恢复、数据完整性和业务连续性。

该解决方案还为 Broadview Networks 树立了竞争优势。大多数电信提供商依靠其他公司运营自己的网络,因此,他们声称具备的异地冗余仅适用于该解决方案的云服务部分。Broadview Networks 拥有自己的网络,并为网络和电话以及其他服务提供比竞争对手更全面、更严格的异地冗余。

这种优势推动了销售额增长。Buckingham 表示:“许多公司选择我们提供服务的一个原因在于:我们能解决并管理众多难题。”他补充说,“若没有 SUSE,我们无法做到这一点。它是我们与 SUSE 的合作及其回应的积极见证。如果没有SUSE 和我们之间的牢固关系,今天我们不可能开发出这款解决方案。”