该用户从未签到
|
以下为携程的简要原因说明:; X; ]. |: D* ?. L% c& _2 D0 K
+ }, i* `: X7 @9 i8 @7 \
1、事件发生原因
" s; _& W( O8 T0 V* [5 g" y% U0 {9 @
经携程技术排查,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。
# x u+ V8 ^0 t1 B
& ]. A4 X8 [" G* Y- m9 t( ~2、为什么恢复时间那么长
4 a. m7 K+ M* ?9 x" y4 r/ f j R; e: ?5 W, o
一般来说,类似携程这样的大型网站承载着繁多业务,其后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个Web Service组成,而每个应用子系统和每个Web Service之间都存在着相互调用的依赖关系。
, g- R8 m) ?' w0 v! P- b
: m$ x5 S$ S3 r1 X" Q" Q发生事件后,携程的技术人员除了需要恢复生产服务器上的执行代码以外,还需要做的是恢复并确保每个应用子系统以及每个Web Service的功能正常,同时确保应用子系统与Web Service间的调用关系得以正常执行。
: A* }* _% q, d
- f: Q2 X. } R. g' l5 F0 j这种验证性的操作需要携程的工程师及运维人员通力合作,尽快恢复生产代码并通过反复地、持续性地调试以确保应用子系统与Web Service功能的正常运行。* h, k* }4 s8 f8 `
4 V9 ?+ K" E/ _9 r5 f/ F# ?! d
携程再次保证,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损,请用户放心并继续使用携程网站及App。4 @0 k. F8 H# a
9 |4 q+ h0 t* z0 Z3 N! }* \
3、如何杜绝此类事件的再次发生?
4 F: g5 j) S$ d! W- |1 Y4 G' b% I9 ]2 _& o% t
携程在系统上做了改进,规范并杜绝技术人员错误删除生产服务器上代码的操作。
4 E0 J+ M2 _0 {, v0 ~
5 G/ i% O, n% k |
|