我的日常

登录/注册
您现在的位置:论坛 盖世程序员(我猜到了开头 却没有猜到结局) 盖世程序员 > 携程为什么恢复时间那么长?
总共48087条微博

动态微博

查看: 719|回复: 0

携程为什么恢复时间那么长?

[复制链接]

1

主题

0

听众

17

金钱

一袋弟子

该用户从未签到

跳转到指定楼层
楼主
发表于 2015-06-02 21:54:19 |只看该作者 |倒序浏览
以下为携程的简要原因说明:. C3 X* v1 F" S; C

! i9 f5 m  X9 U( q0 F' V  E1、事件发生原因
1 B& G) e0 G6 x, h! l- P& o  y3 S7 c' I: I% B2 R% e9 Q0 ~
经携程技术排查,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。
! P7 @* D" M) I. U& T
; \# l& ~9 Y& T3 _2、为什么恢复时间那么长5 P. ?/ a/ c7 h1 t$ [3 p

- d3 m' E7 R" t) q0 a- Y一般来说,类似携程这样的大型网站承载着繁多业务,其后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个Web Service组成,而每个应用子系统和每个Web Service之间都存在着相互调用的依赖关系。
  D+ O, P+ s" \: i6 T0 y
; x. a/ ]5 m8 q; W5 h/ O* M' ]( u发生事件后,携程的技术人员除了需要恢复生产服务器上的执行代码以外,还需要做的是恢复并确保每个应用子系统以及每个Web Service的功能正常,同时确保应用子系统与Web Service间的调用关系得以正常执行。
& O; n: U# S  g, _7 p8 i. g- _1 H) p# F3 s# @, h
这种验证性的操作需要携程的工程师及运维人员通力合作,尽快恢复生产代码并通过反复地、持续性地调试以确保应用子系统与Web Service功能的正常运行。
; `8 r1 T! ?+ P! ?* \1 C
1 L  r) k! P) j/ i% B4 N$ ~携程再次保证,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损,请用户放心并继续使用携程网站及App。3 x7 O8 c& l# z" z$ e/ K  i" X0 \8 y
  n* D1 ^3 Z0 s3 `/ g3 k/ K1 E, {
3、如何杜绝此类事件的再次发生?( J9 q+ i( T! f7 _+ w4 x
5 g+ ]7 }' D) L
携程在系统上做了改进,规范并杜绝技术人员错误删除生产服务器上代码的操作。5 Y" o) I3 M' `3 }" v# ?' D

( _/ U3 g, w  V9 X2 y

科帮网 1、本主题所有言论和图片纯属会员个人意见,与本社区立场无关
2、本站所有主题由该帖子作者发表,该帖子作者与科帮网享有帖子相关版权
3、其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和科帮网的同意
4、帖子作者须承担一切因本文发表而直接或间接导致的民事或刑事法律责任
5、本帖部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责
6、如本帖侵犯到任何版权问题,请立即告知本站,本站将及时予与删除并致以最深的歉意
7、科帮网管理员和版主有权不事先通知发贴者而删除本文


JAVA爱好者①群:JAVA爱好者① JAVA爱好者②群:JAVA爱好者② JAVA爱好者③ : JAVA爱好者③

相关帖子
    快速回复
    您需要登录后才可以回帖 登录 | 立即注册

       

    关闭

    站长推荐上一条 /1 下一条

    发布主题 快速回复 返回列表 联系我们 官方QQ群 科帮网手机客户端
    快速回复 返回顶部 返回列表