CIO访谈实录丨碧生源超融合架构探索之路
客户访谈:制造业 / 服务器虚拟化、桌面虚拟化(VDI)
"超融合"的概念在近几年风头正盛,不仅各路玩家扎堆推出相关解决方案,用户们也纷纷将更多目光投向这一能让 IT 基础架构简化增效的 "新式武器"。
不过,任何新技术被广泛接受的过程中,都会充满波折与不确定性。当市场期待新技术能够解决当前之困、燃眉之急时,也不免怀着隐隐的担忧与疑虑。
超融合的概念太新了,真的成熟靠谱吗?
它没有经过 5-10 年的长期测试,现在敢用吗?
它在怎样的业务环境中更具优势,我们适合吗?
……
事实上,在超融合领域,已经有这么一批早期采用者正凭借超融合技术成功破解当前的 IT 架构难题,并在行业数字化转型中保持领先。
碧生源便是这样的开路先锋。
作为中国保健茶市场的领军企业,碧生源已拥有 17 年的信息化历史,然而随着碧生源近年来业务快速发展,作为承载整体业务运营的信息化体系也亟待升级。从 2016 年下半年开始,碧生源开启了史上最大规模的信息化重构改造。
主管碧生源集团信息系统建设的副总裁张峻,在操刀系统改造的过程中发现,最严峻的挑战不仅来自于应用层面,还有 IDC 的扩容成本及维护复杂度正急剧增长,这让张峻感到措手不及,并逐渐意识到传统模式无法逾越的局限性,不得不寻求其他的替换方案。
此时,超融合技术进入了他的视野。从起初满腹疑虑到最终拍板,张峻经历了怎样的决策过程?碧生源超融合架构的探索之路又如何?
以下文字是我们对副总裁张峻的深度访谈实录,客观呈现了超融合在碧生源真实落地的全过程,以及具有借鉴价值的经验和实战干货 。
Q:请介绍下碧生源信息化的历程?
A:碧生源实际上是 17 年历史了,碧生源在应用信息化的手段上还是比较早的。大约在 2009 年就已开始使用 ERP 系统,财务系统,生产线上使用扫码追溯系统,还有很多销售在使用的传统手机系统。
但在 2016 年以后,其实这个系统就相对比较落后,那时碧生源的业务就严重地受制于此。所以从 2016 年下半年,公司就开始了大规模的信息化重构及重实施进程。
因此,碧生源引入的一系列新应用对底层架构的支持也提出了更高的要求。在 2016 年年初,我们就预见到了传统的技术平台已远远不能适应2017 年的业务发展了。所以 2016 年底我们就开始设计新的 IDC 和服务器集群的系统。
Q:原有的系统遇到了哪些问题?
A:问题主要体现在两方面。一方面是应用。由于原先的应用设计基本上是基于每个部门的需求来开发的,所以各部门之间的割裂比较严重。
第二方面是系统越来越集成,数据量越来越大,我们传统的底层平台,无论从网络(局域网、广域网),还是我们传统租用的 IDC 的存储能力、处理能力,都已经非常非常弱了。比如,我们原来的机房分布在两个地方,一部分在外包租用的 IDC 里,一部分在我们现在的办公大楼,条件非常简陋。所以原来业务经常中断,中断的时候业务部门就乱了,所以出现问题时,IT 人员只能一个系统一个系统去查找原因,然后再解决。
Q:碧生源为何选择超融合架构?
A:根据 2017、2018 年业务规划,我们确定了底层系统扩容的需求。方案分为两部分,原计划是只扩容就可以,但是扩容完之后发现整个 IDC 空间也不够了,所以我们是为了完成系统扩容而必须先进行机房设备的扩容,这比我们实际系统扩容还要增加一倍的预算,时间要耗费将近一年左右才能完成整个的扩容进程。
其实这种情况是把我们逼到无路可选。也是在这时,我们才反复论证超融合这个实施方案。因为原先是沿着传统的方式往前走的,最早的方案我们一直在尝试挤压传统架构的项目实施周期,但无论怎么挤压,6 个月显然是躲不过去的,我们的压力是非常大的。
我们被逼得走投无路时正好有超融合这个解决方案,其实以前我们是不了解有这样的技术方案,所以在这个阶段这种方案的出现吸引了我们注意力。
Q:碧生源如何评估和选择超融合厂商?
A:我们也经历了一段过程,毕竟超融合对我们来讲是个很新的概念。在前期,有四五家服务商在递方案。在这四五家中涉及到超融合的大概有三家。三家当中,SmartX 是专注在超融合的,另外两家是既提供传统架构,也提供超融合架构。但在方案的比较中,有的厂商提出超融合不太成熟,并不建议我们使用超融合方案,更多的还是考量传统架构。
但是,当时项目本身的计划预算已获得公司批准,业务已经发动,我们是在这个进展当中发现机房扩容反而变成了系统扩容必须先要面对的条件。如果设备机房扩容的投资、实施耗费时间都要翻倍的话,对我们来讲是很大的挑战。
在比较这三种方案时,我们觉得虽然超融合可能会存在未知的问题,但是对于我们当前阶段和规模来讲,应该是适合我们的使用条件的。我们在规模可控的前提下,评估了所有系统迁移和未来运营可能存在的风险,结论是超融合在一定阶段来讲我们是可以驾驭的。
第二是在运行维护方面。针对传统架构,我们为了去维护整个网络、服务器、安全、数据库, 当初拟定要组建一个 3-5 人的运营团队,去运作我们升级好的平台。但我们实际考察超融合解决方案中发现,如果我们使用了超融合平台,其实并不需要这么复杂的运营团队。
第三是如果我们引入了全新的超融合,当时我们也没有太强的信心,所以也提出一个观点,就是不仅做技术论证,我们希望实测。所以在最后四家方案当中,有一家听到实测之后是直接退出的,另外两家很犹豫,实测的计划大概持续了将近一个多月,最后不能落地。但实际上在听到实测这个建议的时候,SmartX 的反应还是非常积极的,所以我们虽然跟三家同时在谈实测计划,但最先落地的是 SmartX。
所以一开始,SmartX 就明确提出愿意参加实测,并用一周左右的时间就在我们这里搭出了实测环境。所以理论方案讲得再多,远远不如我们来看最后实测体验。在实测中,一是我们的迁移方案,也就是即将上线的测试系统,二是我们运维的实际演练,我们都在这里进行了实测。部署实测环境大概用了一周,实测测了将近三周到一个月的时间。
从实测结果来讲,我们的实际感受比在当时做方案评估时的感受会更加落地和踏实。也正是基于实测,让我们最终下决心说超融合是我们完全接受和完全可以驾驭的一种方案。实测结果一出来,我们很快,大概不到一周的时间就进入了项目实施。
实际上最后的实施结果确实和我们当时预设是很接近的。真正实际设备到货到安装,我们计划迁移的系统还真就是一周,就全部迁移上去了。
Q:采用超融合之后有哪些成效与收益?
A:我们更新之后的 ERP 系统、HR 系统、OA 系统、数据备份系统、数据分析系统,现在已经全部迁移到超融合体系里了。
使用超融合以后我们有了几个进展。第一,我们业务连续性有了充分保障;第二,我们的存储空间在原有空间内还有若干倍扩展能力;第三,我们的运维人员,原计划 3-5 人来运行整个系统维护,现在实际上只有 2 个人;第四,我们不再使用越来越贵的传统意义上的存储柜设备来存储我们的数据。
Q:使用超融合架构,有哪些经验分享?
A:因为超融合是比较新的概念,从我们引入到真正上线的心路过程还是非常犹豫的。因为一个技术平台的调整对公司的影响非常大。但是,从我们实际使用来看,现阶段的感觉还是不错的。
但毕竟超融合还没有经历过 5 年到 10 年业务压力的长期测试。所以我觉得有几个因素可以考量。
第一,在业务规模可控的前提下,对于需要快速上线、想尽可能简化运营的业务环境下,超融合是一个很好的方向和尝试的选择。
第二,如果规模很大,不一定非要把全部业务一次性押上去,可以在某些系统中先尝试。因为对超融合平台的驾驭、运营的驾驭,包括超融合系统对应用系统的适应能力,还需要一个过程。
另外,我觉得可能跟合作方有关系,所以我们为什么在开始特别强调实测,其实也是非常非常担心这么新的东西,服务商消化技术的能力和对用户最终提供服务的能力到底是否能够跟得上。所以,选择一个比较可靠的服务商,控制好初级试用规模,可能是现在使用超融合非常重要的方法。超融合还是一个非常有潜力的系统方案。
Q:碧生源超融合未来的扩展计划是什么?
A:一是我们需要进行系统整合。第二,所有新购系统也都将基于超融合平台,公司不再组建第二个平台来使用了。至少在目前我们的规模下,在我们目前使用的情况下,我们的策略是全部移向超融合的平台。
Q:如何看待超融合未来的发展?
A:从不了解、不接受,到后来我们很坚决地转向超融合,以及结合我们现在实际使用三个月的情况来看,至少对于我们这样的业务模型和业务方式,我们是很坚决地觉得超融合基本上在未来,在我们现在看到的时间段,这是我们唯一的基础平台。