该用户从未签到
|
以下为携程的简要原因说明:
6 S% R% N' p9 E) K0 t
# w6 _, h) L( y* T1、事件发生原因! M3 h" A& M/ J( H/ {
6 |+ B4 `8 _* ?" S: M, p4 o" |8 n经携程技术排查,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。9 E, G! Q0 c. L" M) }
3 Z* E6 f9 I: e' L" h, c6 S2、为什么恢复时间那么长
' E5 X N7 S- N! T% j7 p& F8 A; b% [, _+ f) g$ X" {
一般来说,类似携程这样的大型网站承载着繁多业务,其后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个Web Service组成,而每个应用子系统和每个Web Service之间都存在着相互调用的依赖关系。
0 o9 z4 y/ \$ r$ u: |
1 s2 ?5 P1 `8 G6 g6 x4 _发生事件后,携程的技术人员除了需要恢复生产服务器上的执行代码以外,还需要做的是恢复并确保每个应用子系统以及每个Web Service的功能正常,同时确保应用子系统与Web Service间的调用关系得以正常执行。: D: U- E! a/ k
/ c9 `4 ]- x- p4 v( f
这种验证性的操作需要携程的工程师及运维人员通力合作,尽快恢复生产代码并通过反复地、持续性地调试以确保应用子系统与Web Service功能的正常运行。
. ]! n0 x/ F+ k+ U4 P! N+ y9 `$ @3 G6 d# I
携程再次保证,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损,请用户放心并继续使用携程网站及App。
* e5 A& }; O4 J; l1 r- W; M- s
3、如何杜绝此类事件的再次发生?9 w u |! K/ G& r2 Y
9 g* @' A' ]( R) g0 g8 W& @
携程在系统上做了改进,规范并杜绝技术人员错误删除生产服务器上代码的操作。 b- V9 [0 \$ }6 X, O
7 `: n4 z8 A( ^5 F
|
|