该用户从未签到
|
以下为携程的简要原因说明:
9 h v3 h1 C6 R' S/ V2 v( |8 E
) M6 Q" y& ]9 W5 o1、事件发生原因
4 }4 j6 O4 Y& }5 s; R/ d0 i" [- F2 g5 d K+ X# c
经携程技术排查,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。
1 s% u# v: ?7 ]- n
' d. Q& p" M/ N' j' `2 ]2、为什么恢复时间那么长
P. d7 I' f3 f
. F, \# l" ~' W; @, M, l. u% s5 w一般来说,类似携程这样的大型网站承载着繁多业务,其后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个Web Service组成,而每个应用子系统和每个Web Service之间都存在着相互调用的依赖关系。
5 ^# v G& p R% E* u
; \8 |2 T' o) i$ X3 l发生事件后,携程的技术人员除了需要恢复生产服务器上的执行代码以外,还需要做的是恢复并确保每个应用子系统以及每个Web Service的功能正常,同时确保应用子系统与Web Service间的调用关系得以正常执行。
! u# U+ r4 O% l9 L, v* J
$ ~1 I( ^" O+ T. T! B- d这种验证性的操作需要携程的工程师及运维人员通力合作,尽快恢复生产代码并通过反复地、持续性地调试以确保应用子系统与Web Service功能的正常运行。; X' n3 i7 a- q) G2 j, D" L
- }7 ?" R3 k$ A: K8 n2 t携程再次保证,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损,请用户放心并继续使用携程网站及App。0 B5 l, j z& {3 C) e
* h3 X( D, Z+ _! R
3、如何杜绝此类事件的再次发生?3 D) m) _9 i# @( d# K) r
/ x& ]8 Z( T6 x4 L+ n# g携程在系统上做了改进,规范并杜绝技术人员错误删除生产服务器上代码的操作。
7 a7 V; R+ o& A% x* t; ^/ k6 Y. z! h/ l G; K K/ [5 q# C2 L8 V0 }$ H4 K6 D
|
|