该用户从未签到
|
以下为携程的简要原因说明:+ ^/ I4 I( @3 L
0 ], F: H- H& o: h$ X" V% _2 X1、事件发生原因
9 P2 j) X z+ ^" Y3 L
* \3 R, l; f" [& g3 P( m( u- j经携程技术排查,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。) y* h! W6 R3 J8 D
1 `( R5 [; P8 W( q
2、为什么恢复时间那么长0 F# p* }, r" J/ T! \+ `
H1 W. _" [& _1 k+ h! c一般来说,类似携程这样的大型网站承载着繁多业务,其后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个Web Service组成,而每个应用子系统和每个Web Service之间都存在着相互调用的依赖关系。
, ~/ P6 `, v7 a3 e: L5 _, @, v" f8 ~% _8 F0 Q) x
发生事件后,携程的技术人员除了需要恢复生产服务器上的执行代码以外,还需要做的是恢复并确保每个应用子系统以及每个Web Service的功能正常,同时确保应用子系统与Web Service间的调用关系得以正常执行。
: C/ R" b* ^5 c2 n/ y; b/ \ ~8 e
3 S( i9 c4 p/ [0 u) S$ H这种验证性的操作需要携程的工程师及运维人员通力合作,尽快恢复生产代码并通过反复地、持续性地调试以确保应用子系统与Web Service功能的正常运行。' u: z5 K- X, F! j
( O3 ?# I0 p, E9 g6 Q
携程再次保证,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损,请用户放心并继续使用携程网站及App。
" y, M. k1 o! `
/ i3 F3 J8 g3 x9 D. V6 j4 ^3、如何杜绝此类事件的再次发生?
8 g6 D7 g6 ?7 R; L; X4 _
3 z1 Q5 y/ C7 w" B/ t: l" _: }+ ?携程在系统上做了改进,规范并杜绝技术人员错误删除生产服务器上代码的操作。% M D+ I0 u( W. {/ z& K
1 U# n% G$ ]8 v: ^
|
|