该用户从未签到
|
以下为携程的简要原因说明:9 ?. q( d. Z# s- Q$ b( a
2 y# i' I" ^; D
1、事件发生原因9 w5 E0 P, _5 C' G: O c( V
) n5 D, j7 S3 U9 P经携程技术排查,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。
@( _1 a% K5 Z8 Z' C8 i% ^$ W, `+ Z) u
2、为什么恢复时间那么长+ @! n! r4 |+ j- x( d
5 @ v' P; g7 B( S! J
一般来说,类似携程这样的大型网站承载着繁多业务,其后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个Web Service组成,而每个应用子系统和每个Web Service之间都存在着相互调用的依赖关系。
$ h( Z, t: Q! j9 ]% H2 M; \, S9 V U+ N# H" b- ^" i9 R1 W9 N
发生事件后,携程的技术人员除了需要恢复生产服务器上的执行代码以外,还需要做的是恢复并确保每个应用子系统以及每个Web Service的功能正常,同时确保应用子系统与Web Service间的调用关系得以正常执行。
3 h. {; r; e# G2 @
: N5 V" G5 Z! H" ]1 `: Z这种验证性的操作需要携程的工程师及运维人员通力合作,尽快恢复生产代码并通过反复地、持续性地调试以确保应用子系统与Web Service功能的正常运行。
7 X7 ?; ]. }# T6 u8 K
7 E- @( t7 @" `2 @. R: L! R携程再次保证,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损,请用户放心并继续使用携程网站及App。$ Q u3 a3 Y" d$ L
`$ @6 {2 Z" C: _! i ?# ?+ ?7 H: e3、如何杜绝此类事件的再次发生?
8 \! ]' ` W$ R2 d2 g
- t& I' E. D6 E- L携程在系统上做了改进,规范并杜绝技术人员错误删除生产服务器上代码的操作。4 n& H: U t f: m/ e( U
/ a9 b- U/ s8 ?) s( D: r5 j |
|