该用户从未签到
|
以下为携程的简要原因说明:
G9 y# `8 a l Z0 [& m+ }
% ^1 i2 Y" \" Y6 M& M0 J1、事件发生原因' L( t$ B, N! ~# ^) k6 Y5 f
3 N. p. P+ b( k
经携程技术排查,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。
$ |+ N/ V- o6 \, k0 t$ W
$ U6 A) y2 U' n m2、为什么恢复时间那么长$ }5 s3 P0 d% i1 R0 f% @
7 z* A3 l) g6 {( G6 i
一般来说,类似携程这样的大型网站承载着繁多业务,其后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个Web Service组成,而每个应用子系统和每个Web Service之间都存在着相互调用的依赖关系。4 R. L- M b2 C* A/ p' @
9 S4 \9 K5 s/ J0 F- G0 P( W发生事件后,携程的技术人员除了需要恢复生产服务器上的执行代码以外,还需要做的是恢复并确保每个应用子系统以及每个Web Service的功能正常,同时确保应用子系统与Web Service间的调用关系得以正常执行。5 U% E! y: B7 L. p9 H2 E
2 p( h$ F5 h9 q" y" ^( B这种验证性的操作需要携程的工程师及运维人员通力合作,尽快恢复生产代码并通过反复地、持续性地调试以确保应用子系统与Web Service功能的正常运行。4 |8 _2 F7 K: I( o5 [* g
2 }/ X( U2 _9 M携程再次保证,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损,请用户放心并继续使用携程网站及App。# b2 `1 G! l- r, M/ _
# n5 V$ `1 \; s/ j3 R$ c! N( f3、如何杜绝此类事件的再次发生?
" C) A1 O7 t* |6 x' Z. t, W( d
$ r& _! A1 h3 W7 K9 S+ h, d携程在系统上做了改进,规范并杜绝技术人员错误删除生产服务器上代码的操作。
( U4 A2 z i6 s3 P. t3 f* L' F2 P+ w* D; n# @7 U# ]
|
|