该用户从未签到
|
以下为携程的简要原因说明:
7 S, _ {) c* f0 X( D y$ N4 a1 F3 r5 ^, C6 F9 Z5 B u/ b
1、事件发生原因5 q8 f! R7 ~/ _9 S a% l3 r
+ J `' t3 ~" c经携程技术排查,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。
& @9 e1 C1 {+ z0 o P
0 O7 d; p8 q! s% Y! m/ r2、为什么恢复时间那么长- \, S- J7 p: L: C# T
2 S) H( s% e. V: h6 Y4 }
一般来说,类似携程这样的大型网站承载着繁多业务,其后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个Web Service组成,而每个应用子系统和每个Web Service之间都存在着相互调用的依赖关系。
$ n5 n/ Y$ d. `3 x9 o* a5 {$ w8 y( a e* r
发生事件后,携程的技术人员除了需要恢复生产服务器上的执行代码以外,还需要做的是恢复并确保每个应用子系统以及每个Web Service的功能正常,同时确保应用子系统与Web Service间的调用关系得以正常执行。
% v% k* X( y- g% X+ E$ s$ y* M# W
这种验证性的操作需要携程的工程师及运维人员通力合作,尽快恢复生产代码并通过反复地、持续性地调试以确保应用子系统与Web Service功能的正常运行。. _: u: D! E+ h2 g
7 _ X3 }6 i g, p$ J: G' T携程再次保证,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损,请用户放心并继续使用携程网站及App。
% t. u. ^# o4 p' F$ q/ `0 ^1 H$ k7 X/ Q7 P' X5 l3 q, a: x
3、如何杜绝此类事件的再次发生?- O4 c8 O4 \( g& w; [ j" b5 f N
0 |1 A5 b$ n4 p7 Y4 X
携程在系统上做了改进,规范并杜绝技术人员错误删除生产服务器上代码的操作。6 H3 `5 O O& b+ ]
$ F4 o" q) `# A1 m9 q
|
|