携程网亚马逊宕机事件件,可以给同行提供什么经验和教训

5月29日消息,今天凌晨1:30分,经技术排查向新浪科技确认此次事件是由于员工错误操作导致。对于恢复时间较长,携程回应称,因涉及的业务、应用及服务繁多,验证应用与服务之间的功能是否正常运行,花了较长时间。携程官方网站及APP已于28日23:29全面恢复正常。以下为携程对相关问题的说明:1、事件发生原因经携程技术排查,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。2、为什么恢复时间那么长一般来说,类似携程这样的大型网站承载着繁多业务,其后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个Web Service组成,而每个应用子系统和每个Web Service之间都存在着相互调用的依赖关系。发生事件后,携程的技术人员除了需要恢复生产服务器上的执行代码以外,还需要做的是恢复并确保每个应用子系统以及每个Web Service的功能正常,同时确保应用子系统与Web Service间的调用关系得以正常执行。这种验证性的操作需要携程的工程师及运维人员通力合作,尽快恢复生产代码并通过反复地、持续性地调试以确保应用子系统与Web Service功能的正常运行。携程再次保证,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损,请用户放心并继续使用携程网站及App。3、如何杜绝此类事件的再次发生?携程在系统上做了改进,规范并杜绝技术人员错误删除生产服务器上代码的操作。
24小时报不停
真球迷:苹果高级副总裁库伊将拍卖慈善午餐,支持NABC
网传42所“双一流”大学名单出炉 教育部回应:名单将8月底左右公布
众安拟IPO融20亿美元 互联网保险首股钟情港交所
微软送1TB OneDrive空间?免费体验Office 365个人版一个月
微软送1TB OneDrive空间?免费体验Office 365个人版一个月
微软高管:iPad Pro是苹果抄袭微软很明显的例子
银监会再度整治校园贷:网贷平台一律暂停相关业务
还活着!金山推出WPS Office 2016 for Linux免费下载
索尼XZ Premium蜘蛛侠套装开卖:5888元,限量618套
亚马逊史上最大手笔!137亿美元收购全食超市
亚马逊用户一夜被客服骗走43万 原因是办理退货
无边框大屏,索尼XPERIA XA1 Ultra国行版将至
乐视手机轰然倒下?售后维修关门停摆
乐视宣布三高管任命:原乐视网财务总监加盟乐视控股
美国公司发布无人机的士:事故时能把人“弹”出去
谷歌或面临欧盟超10亿欧元的罚款
蚂蚁金服设立专项基金,1个亿扶持信用生态创业者
Gartner公布2017年全球云计算魔力象限:阿里云进入前四
Maxent猛犸反欺诈获5000万人民币A+轮融资,DCM领投
Netflix取得象征性胜利:美国付费用户数超有线电视
三星Note8浏览器性能测试曝光,全视屏尺寸确定
美国政府牵头6家公司开发新一代超算,与中国竞争
欧洲法院裁决海盗湾侵权:或掀起BT网站封杀潮
苏宁银行获准开业:注册资本40亿元,黄金老任行长
摩拜单车宣布完成6亿美元新一轮融资,腾讯领投&支付宝运维团队创始人深入解析和反思携程宕机事件
秒后自动跳转到登录页
快捷登录:
举报类型:
不规范:上传重复资源
不规范:标题与实际内容不符
不规范:资源无法下载或使用
其他不规范行为
违规:资源涉及侵权
违规:含有危害国家安全等内容
违规:含有反动/色情等内容
违规:广告内容
详细原因:
任何违反下载中心规定的资源,欢迎Down友监督举报,第一举报人可获5-10下载豆奖励。
视频课程推荐
支付宝运维团队创始人深入解析和反思携程宕机事件
上传时间:
技术分类:
资源评价:
(1位用户参与评价)
已被下载&7&次
支付宝运维团队创始人深入解析和反思携程宕机事件
本资料共包含以下附件:
支付宝运维团队创始人深入解析和反思携程宕机事件.txt
51CTO下载中心常见问题:
1.如何获得下载豆?
1)上传资料
2)评论资料
3)每天在首页签到领取
4)购买VIP会员服务,无需下载豆下载资源
5)更多途径:点击此处
2.如何删除自己的资料?
下载资料意味着您已同意遵守以下协议:
1.资料的所有权益归上传用户所有
2.未经权益所有人同意,不得将资料中的内容挪作商业或盈利用途
3.51CTO下载中心仅提供资料交流平台,并不对任何资料负责
4.本站资料中如有侵权或不适当内容,请邮件与我们联系()
5.本站不保证资源的准确性、安全性和完整性, 同时也不承担用户因使用这些资料对自己和他人造成任何形式的伤害或损失
相关专题推荐
不论你是黑客发烧友,还是网络安全工
网络管理人员应认真分析各种可能的入
DDOS全名是Distributed Denial of se
本着学习和研究的精神,以知己知彼为
本视频专题包涵从了解互联网世界,服
本专题收集了渗透中常用的一些工具(
本专题为黑客入侵基础视频教程,共10
  目前国内发行量最大的网络安全(
本专题为电脑报随书视频——《黑客入
本专题为黑鹰破解视频教程基础篇,掌
本专题为黑客入门常用dos命令视频教程
网络安全管理视频,阐述网络安全的基
TCP/IP协议详解,包括了链路层、ARP、
本专题为学习黑客技术朋友们提供的新
本专题为WEB安全-渗透测试安全培训视
本专题为华中红客基地的网站入侵视频
意见或建议:
联系方式:
您已提交成功!感谢您的宝贵意见,我们会尽快处理宕机事件|携程在宕机事件中是如何被玩坏的?
当前位置: && 正文
宕机事件|携程在宕机事件中是如何被玩坏的?
17:20:11 来源: 责任编辑:
篇一 : 携程在宕机事件中是如何被玩坏的?篇二 : WhatsApp创始人为周六宕机事件道歉 承诺不再发生 上周六WhatsApp的服务遭遇4小时宕机 网易科技讯 2月24日消息,据国外媒体报道,上周六就在Facebook以160亿美元高调收购Whatsapp的短短几天之后,WhatsApp的服务遭遇了前所未有的4小时宕机。今天,创始人兼首席执行官Jan Koum出面为宕机事件道歉,提供宕机技术细节和新的相关信息。 Koum在一封电子邮件中表示,&这是我们历史上最长和最大规模的宕机时间,影响了我们所有的用户。&根据Koum的说法,罪魁祸首是一个出错的网络路由器。这引起了一系列连锁故障,最终影响了WhatsApp服务器。 Koum对路由器问题的根本原因语焉不详,但其解释表明宕机事件可能与Facebook的收购所带来的大量新增流量无关。不过,虽然本次宕机十分严重,但是Koum表明公司正在采取新的措施与其网络服务供应商进行密切合作,以防止未来的宕机事件。用Koum的话说,&就是确保它不会再次发生。&(秉翰)篇三 : WhatsApp周六发生三小时宕机事件WhatsApp在Twitter上发布消息称WhatsApp服务已经恢复 新浪科技讯 北京时间2月23日上午消息,刚刚被Facebook以190亿美元天价收购的即时通讯软件WhatsApp周六出现宕机事件,3个多小时后服务恢复正常。 美国东部时间周六下午5:48分,WhatsApp在Twitter上发布消息称WhatsApp服务已经恢复并就本次故障向用户道歉。 此前,WhatsApp曾表示该应用服务器有一些问题,但未说明问题的细节。该应用创立5年,现在在全球拥有约4.5亿用户,而且还在以每天100万人的速度增长。(无双)
内容:/61247.html
文章很赞,分享给朋友
04-05· 04-21· 04-12· 05-15· 04-19· 05-04· 04-27· 04-07· 04-06· 04-15· 04-07·
05-01· 05-27· 05-07· 05-10· 03-31· 04-05· 04-13· 04-13· 05-06· 04-08· 04-26·
1 2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 7 8 9 10 11 12
免责声明:本站作品均来自网友分享或互联网,若您发现本站存在您非授权的原创作品请第一时间联系本站删除,本站享有代替本站作者维权的权力。 CopyRight @ 2008- 生活小百科,All Rights Reserved 版权所有
粤ICP备号-12015 年 5 月 28 日的携程网宕机事件,可以给同行提供什么经验和
相关提问:如果在公司里不小心把数据给删除了会怎么样? - 互联网~~~~~~~~~~~~~~~~~~~~~~~~~~~~网友回复:
~~~~~~~~~~~~~~~~~~~~~~~~~~~~网友回复:
哼,有什么好怕的,我来给你们讲讲我的经验。我刚入行的时候就在一家做舆情监测的数据服务公司。我上班不到一周就在公司的某个爬虫库里,写了个不带查询条件的Update。在我意识到“不好!”点下终止按钮前,数百万条数据已经没了。错的不是我,是世界!是给我update权限的项目经理啊!我上报这个事情的时候我以为我死定了,结果经理拍拍我的肩膀说:“没事的,都在意料之中,你操作的是镜像库。”当时就觉得谢天谢地,太好了,还好没搞出纰漏。嗯。。。?哪里不对。。。 卧槽,意料之中是什么鬼?!结论: 不要信任实习生啊混蛋。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~网友回复:
针对艺龙发布的被黑客拒绝服务攻击的声明和360发布的协助艺龙进行流量清洗的报告,我就不做详细评论了,虽然离开艺龙已久,还是有的,有兴趣的同学可以自己去看看,然后做做算术,我只能说,做市场的同学要学好技术和数学,不然很容易出笑话。==========某携程员工的评论,我替你删了,你们内部现在统一PR口径,我不觉得你的回复符合携程公司策略和利益。对于你的质疑,我是携程用户,级别也不算太低,关于恢复当天的数据状况我们也做了实测,如果携程公司对我们实测的结果有疑问欢迎技术上进行探讨,错了我可以道歉。但是人力资源是不是合适的技术讨论对象和对外发布内容的岗位我略有质疑。=========两条:携程微博:5月29日1:30分,经携程技术排查,确认此次事件是由于员工错误操作导致。由于携程涉及的业务、应用及服务繁多,验证应用与服务之间的功能是否正常运行,花了较长时间。携程官方网站及APP已于28日23:29全面恢复正常。对用户造成的不便,携程再次深表歉意。//估计最后还是定性为内部事故了。华尔街日报:“携程被黑”Updated May 28,
p.m. ETBEIJING―China’s largest online travel company,
~~~~~~~~~~~~~~~~~~~~~~~~~~~~网友回复:
不是同行,但有个类似的经历……我的导演搭档有次一个不小心,把服务器上一整部未完成动画的工程文件全删了……他偷摸四处找人回收文件,上传了三天……然后流着冷汗把自己的操作权限下调了三级。还好动画公司的工程文件都是每个人各自的部分会各自存一个本地版。我听完之后,也赶紧打了申请把服务器操作权限下调。妈的吓死了。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~网友回复:
看到大家说重视运维人员,提高待遇,加强管理。我想大家要失望了,管理要加强的,责任要落实的,待遇是没有的。权利小,责任大,黑锅肩上扛。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~网友回复:
-----------------------------------------------------update----------------------------------------------------------------5月28日(昨日)22:45 携程发布官方声明称“除个别业务外,携程官方网站及APP恢复正常”,数据无丢失。23:29 全面恢复正常,数据没有丢失,预订数据也保存完整。目前的消息是,携程瘫痪事件的主要原因是内部敏感系统权限管理不当(前面回答中也说到了),业务更新中对版本的控制不够、没有合适的灰度策略,作为一家互联网公司,能中断10个多小时的业务,确实比较少见。有人根据携程一季度财报公布的数据,业务中断导致的每小时损失为106.48万美元,那么11小时36分钟的系统瘫痪相当于损失万美元。携程今天凌晨也在官方的微博公告中,指出是“员工错误操作”导致。不知道会怎么处理!这么多RMB,够免费给携程干一辈子的了。简单科普下物理删除和逻辑删除的概念吧:物理删除指的是文件存储所用到的磁盘存储区域被真正擦除或者清零了,删除后文件不可恢复。逻辑删除其实就类似于我们平常删除文件,包括格式化等操作,这种删除操作是可逆的,用一些工具或软件是可以把删除的文件恢复过来的。所以,如果是全部被物理删除,那公司基本就完了。--------------------------------------------------------------5.28
20:00回答-----------------------------------------------------今天上午出来的问题,一天都这么多人关注了,过来凑凑热闹,虽然 @Michael282694 没有邀请我!后台知识只懂皮毛,以下拙见,纯属猜测!PS:目前携程仍在瘫痪中。。。网上有人传说数据库被内部员工(一说离职员工)物理删除,官方的回应是因为遭遇不明攻击。。。网上有人传说数据库被内部员工(一说离职员工)物理删除,官方的回应是因为遭遇不明攻击。。。先不管是不是遭遇攻击,物理删除这事基本不可能(难道是一个叫物理的工程师把数据给删除了。。。),作为上市公司,这种关键数据首先在后台架构上会有多处备份,权限和安全机制上也会有严格限制,不可能一个员工有所有机器的root权限,如果真是这样,只能说携程内部对后台数据的管理存在很大问题。携程在安全方面不够重视,这点最近两年大家都有目共睹,去年就爆出过一些相当低级的漏洞。遭遇攻击,还是有可能的,毕竟现在业务基本是全线挂掉了,而且到现在还没恢复,这么说很大可能确实是大部分数据库挂掉了,如果只是部分数据库被删,应该很快使能够恢复的,而且也不至于全线的业务都挂掉,最大的可能应该是主从服务器的数据都被逻辑删除(别再想物理删除了)了,这还不算完,数据还可能被覆盖了,这样就很蛋疼了。至于是内部员工还是黑客,只要他自己知道,反正如果真是有人攻击,查出来的话,这辈子肯定废了!还有一点,很多公司应该都有后台数据备份,但是向数据大面积丢失或删除这样的事情,太少见,所以可能很多公司并不是特别重视,以至在真正出现数据丢失的问题时,应变能力不强。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~网友回复:
宕机之后看谁不爽就在首页挂上:请先到XXX浏览。给他个DDOS让他也爽一下
~~~~~~~~~~~~~~~~~~~~~~~~~~~~网友回复:
如果真的数据库被物理删除,那么干这事的人,一定能访问到数据的物理文件,也就是说他有机会获得数据库内容。我还曾经听说,携程把信用卡号,有效期,CVV码都放在数据库里,说是改善用户体验。似乎有些奇妙的事情要发生了。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~网友回复:
1运维自动化程度太高,权限分配不合理,导致如果发布平台有问题,整个生产线都会瘫痪。2应用业务逻辑太复杂,研发人员对此不重视,导致重启频频报错,无法快速恢复生产环境。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~网友回复:
路过解释下什么叫物理删除。一般重要的数据保存在数据库的时候,我们去删它不是把它直接从数据库里面删除,而是通过一个标志位,给这条数据做个删除标记。也就是说这条数据还在数据库,只是逻辑上我们删除了,在业务处理里面看不到而已。所谓的物理删除,就是不通过标志位,直接在数据库里面把这条数据给删了。如果没有日志或者备份,那就是不太容易恢复了。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~网友回复:
不要用windows。。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~网友回复:
这件事情告诉我们「物理」这个碧池真的很厉害。还有,携程连数据库都没备份吗,DBA干嘛吃的←_←额,不会就是DBA干的吧(⊙_⊙)艹,赶紧回去看数据库,搞不好这个专业要火!
~~~~~~~~~~~~~~~~~~~~~~~~~~~~网友回复:
我觉得核心需要解决的问题是:“决策层多关心、照顾下 一线从事信息安全、研发、运维岗位的同学。”经验、教训?前面说了那么多没用的,信息安全、研发、运维岗同学薪资翻个两三倍 我觉得这些问题都可以解决。同意的就点赞吧.
~~~~~~~~~~~~~~~~~~~~~~~~~~~~网友回复:
网易挂,网易挂,网易挂完支付宝挂,支付宝挂,支付宝挂完携程挂,携程挂,携程挂完我让你艺龙挂异地容灾很有必要
~~~~~~~~~~~~~~~~~~~~~~~~~~~~网友回复:
我想说,国内的互联网公司他妈就不能多重视一下安全?多招几个网络安全人员?把网络安全人员当保安,可有可无的公司,出事就是活该。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~网友回复:
可能是这样子:rm -rf /usr /lib/nvidia-current/xorg/xorg
~~~~~~~~~~~~~~~~~~~~~~~~~~~~网友回复:
先得统一对外口径
【2015 年 5 月 28 日的携程网宕机事件,可以给同行提供什么经验和】
请将本文分享给你的朋友:
2015 年 5 月 28 日的携程网宕机事件,可以给同行提供什么经验和 的相关文章
------分隔线----------------------------
北京联盟郑重声明:本文仅代表作者个人观点,与北京联盟无关。其原创性及文中陈述内容未经本站证实,北京联盟对本文及其中全部或者部分内容的真实性、完整性、及时性不作任何保证和承诺,请网友自行核实相关内容。}

我要回帖

更多关于 宕机事件 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信