该用户从未签到
|
以下为携程的简要原因说明:$ _) w, {# c: j! p
9 B6 P2 o0 F; [! K1、事件发生原因
7 c" n5 d$ c% L- ^2 t" O7 \" h/ u! Q$ D1 m3 X
经携程技术排查,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。% c L, k3 M* T# `7 r' I8 E' v/ x
+ P; ?# I T! D) S1 k# w2、为什么恢复时间那么长
+ Z* G. s& Z3 u" X) K* b1 X U2 h/ y; x+ w
$ i0 I0 B6 L& |# l1 n一般来说,类似携程这样的大型网站承载着繁多业务,其后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个Web Service组成,而每个应用子系统和每个Web Service之间都存在着相互调用的依赖关系。
7 w4 {6 i0 a3 m
- ]( K$ |+ }2 j8 c7 s7 P8 V发生事件后,携程的技术人员除了需要恢复生产服务器上的执行代码以外,还需要做的是恢复并确保每个应用子系统以及每个Web Service的功能正常,同时确保应用子系统与Web Service间的调用关系得以正常执行。7 \! N2 G# Z& D: D
" ~' U ]! U0 b1 L% q
这种验证性的操作需要携程的工程师及运维人员通力合作,尽快恢复生产代码并通过反复地、持续性地调试以确保应用子系统与Web Service功能的正常运行。5 P9 p6 B- P& h$ s7 t& t
3 ^7 Z9 R {) Z5 |* H( X携程再次保证,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损,请用户放心并继续使用携程网站及App。" i7 [3 n y. }* \) v2 G
! [6 a0 F5 p5 @3、如何杜绝此类事件的再次发生?% q9 o* E- x) F: l
: {) R6 u5 w( w$ R i携程在系统上做了改进,规范并杜绝技术人员错误删除生产服务器上代码的操作。
/ a+ I! a. v2 P$ o: C8 ]( x3 X C" E1 N }3 `' W, c
|
|