该用户从未签到
|
以下为携程的简要原因说明:
t# r! O* @( j3 T' q/ h/ Z# D- e& o" P0 V
1、事件发生原因
" y, u9 e- o, u/ p* X! P- Y4 g7 y6 _9 x3 d) g
经携程技术排查,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。
: P. i e ]: `" o( u- A/ c9 O$ q8 [: \2 V7 i. x; C
2、为什么恢复时间那么长
7 {# f. I0 `% Z+ ?2 b$ C$ D& ]7 R( z. T( l2 V! n
一般来说,类似携程这样的大型网站承载着繁多业务,其后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个Web Service组成,而每个应用子系统和每个Web Service之间都存在着相互调用的依赖关系。; Y3 B; g* R0 U/ Q
0 \6 G- _1 H6 a) p) t6 _& M5 e
发生事件后,携程的技术人员除了需要恢复生产服务器上的执行代码以外,还需要做的是恢复并确保每个应用子系统以及每个Web Service的功能正常,同时确保应用子系统与Web Service间的调用关系得以正常执行。
3 J2 T9 G* m' I9 }! _& I( m7 P5 w( d m) H. `6 y( e3 B e+ W
这种验证性的操作需要携程的工程师及运维人员通力合作,尽快恢复生产代码并通过反复地、持续性地调试以确保应用子系统与Web Service功能的正常运行。/ n* y D) ^* f0 t1 p4 |
. I: N2 [ z$ R. `' d0 ?
携程再次保证,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损,请用户放心并继续使用携程网站及App。
9 [1 z* w. n6 n$ j8 W6 n; e9 d9 W8 b! C# `+ @+ ]
3、如何杜绝此类事件的再次发生?
" B: |6 R: E: V. Z4 l7 s
; F e$ `( m$ Z. S5 ]/ @携程在系统上做了改进,规范并杜绝技术人员错误删除生产服务器上代码的操作。# p: |5 W- X3 {# y6 Y% N9 u
; K" n+ c) ]8 j! j. [" q |
|