该用户从未签到
|
以下为携程的简要原因说明:
% ^6 u) ]( F; R: J
4 G. W+ K; j4 R" O1、事件发生原因
# l5 F+ o* Z: z6 G! ], _; D
# I, k" x" } o( B" i+ F经携程技术排查,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。
B- f* y$ ~0 Y' K" p+ I% D) |! H
( A' L% T& a" u3 r2 _2、为什么恢复时间那么长+ y: l9 e: @! i
! V! y- m' W% B* O
一般来说,类似携程这样的大型网站承载着繁多业务,其后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个Web Service组成,而每个应用子系统和每个Web Service之间都存在着相互调用的依赖关系。0 }+ T6 ]- x' [7 T* [
" ~3 C. l# D6 }4 n" b7 g% q6 K发生事件后,携程的技术人员除了需要恢复生产服务器上的执行代码以外,还需要做的是恢复并确保每个应用子系统以及每个Web Service的功能正常,同时确保应用子系统与Web Service间的调用关系得以正常执行。 E5 r. {2 w" i2 N
' b( w; r9 }, Y& x$ `+ V
这种验证性的操作需要携程的工程师及运维人员通力合作,尽快恢复生产代码并通过反复地、持续性地调试以确保应用子系统与Web Service功能的正常运行。1 }( V V$ [/ J4 K) i9 a6 W
8 Y' }$ {, ~ a7 g3 L% z携程再次保证,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损,请用户放心并继续使用携程网站及App。
" [, h4 Z( r# a4 |2 J
# c' b7 K6 h4 [1 W3、如何杜绝此类事件的再次发生?) I X' @+ W0 n1 g
( e, w |+ H+ w) x6 E% e+ h携程在系统上做了改进,规范并杜绝技术人员错误删除生产服务器上代码的操作。' p0 D! f! [9 L$ e& Z
9 E) z0 ^5 P7 b: v& I" R |
|