亚马逊AWS S3效劳中断,云存储的那些坑怎么防止?
本文摘要:本周二,亚马逊AWS位于弗吉尼亚州的呈现故障,影响数千个在线效劳,Netflix、Airbnb、Slack、Spotify、yahoo网络Email等互联网效劳遭到显着影响。亚马逊AWS陈述称,云存储效劳S3呈现了 高过错率 。亚马逊将S3定位为 简略存储处理计划 ,数据显示,S3被近15万

本周二,亚马逊AWS位于弗吉尼亚州的呈现故障,影响数千个在线效劳,Netflix、Airbnb、Slack、Spotify、yahoo网络Email等互联网效劳遭到显着影响。亚马逊AWS陈述称,云存储效劳S3呈现了 高过错率 。亚马逊将S3定位为 简略存储处理计划 ,数据显示,S3被近15万家网站使用,此次故障影响规模极广。

现在,云存储现已成为互联网和传统企业的必备基础效劳,国内云厂商怎么下降云存储的危险?就此问题,小编连线腾讯云目标存储COS团队。

腾讯云是国内最大的云存储效劳提供商之一,腾讯云的目标存储COS,为 微信朋友圈 等海量事务提供云存储效劳,腾讯云有什么样的对策?

腾讯云目标存储COS团队认为,本次事故是亚马逊的一个数据中心呈现了事故,引发了云存储效劳的中断,事故是一个成果,问题可能呈现在任何一个方面, 而容灾是应对这类问题的处理计划,磁盘等级容灾,效劳器等级容灾,集群等级容灾可以在数据中心的事故发生前防止问题,而机房等级容灾和跨地域容灾则在机房事故发生后解决问题 。

针对类似工作,腾讯云可以提供上述5大容灾效劳,分别从磁盘、效劳器、集群、机房、跨地域等五个方面,为云存储提供全方位的可用性保障:

. 磁盘等级容灾:多备份数据冗余

关于保存在腾讯云存储效劳中的每一个数据块,都完成了 RAID 备份,即一份数据会存在多个副本或者校验码。同时使用底层磁盘的接口将其每一个磁盘且分为多个扇区,并监控各个扇区的状况。

一旦检测出磁盘部分扇区发生异常,会停止针对该扇区的写入和读取,然后使用冗余数据对原本的扇区进行修复。在这个修复过程当中用户仍然可以读取冗余数据,效劳继续可用。

. 效劳器等级容灾:条带化打散数据

腾讯云使用 条带化 技能,将多备份的用户数据分解成多个数据块均匀放置在不同效劳器之间。一旦检测出单台效劳器呈现异常,会停止对整个集群的数据写入,将数据写入迁移到同机房的其他集群中,随后集群内部针对异常效劳器启动坏盘修复。

假如修复失败,7*24值班的运维人员将人工介入,替换坏盘。在修复过程当中,用户可以从异常集群中健康的效劳器中继续获取数据,效劳继续可用。

. 集群等级容灾:不同集群互为主备

腾讯云在每个机房中会装备多个集群,每一个集群可以提供完好效劳,用户的数据块被散布在不同集群的不同效劳器中。假如某个特定集群失掉效劳才能,修复方式好像效劳器异常。该集群全体暂停数据的写入和读取,保留异常现场,将数据写入迁移到同机房的其他集群中,集群内部开始主动修复逻辑模块或者存储模块。在修复过程当中,用户可以从其他健康集群中继续获取数据,效劳继续可用。

. 机房等级容灾:可用区物理阻隔

腾讯云现在在每一个存储大区装备了多个可用区,每一个可用区之内装备多个机房。每一个可用区保证一定物理间隔,当发生爆炸,洪水等恶劣的物理状况或者小规模运营商网络瘫痪,腾讯云将主动调度数据的写入和读取,暂停灾难受影响区域的机房使用,保留存量数据不改变。

在灾难过程当中新的数据写入和读取,将迁移到同城的其他机房或者临近城市的机房,全体存储大区的效劳不中断。同时腾讯云提供跨机房跨可用区的数据冗余备份才能。

. 跨地域等级容灾:跨地域主动备份

腾讯云现已在华北大区,华南大区,华东大区,西南大区和东南亚大区提供了数据存储效劳,并且提供 主备数据中心 的处理计划,用户可以选择将主站的数据效劳保留在某一区域,同时在上千公里之外保留备份数据,腾讯云将替代客户将主数据中心的数据在短时间内主动搬迁到备份数据中心。

当发生运营商网络大规模瘫痪或者大面积灾难降临,用户可以将效劳指向备份数据中心存储区域,应对反常问题。

用户未来还可以选择腾讯云行将推出的离线存储效劳,以极低的本钱享用到灾备数据的保护。

现在,腾讯云现已向群众点评,广东气候局、芒果TV、CNTV等多家企业提供可靠安稳的效劳。


14:50:41 云技能 Oculus宣布为Rift和Quest提供云存储功用 Oculus 商铺的 SDK 已支撑 Oculus Quest 、 Oculus Go 和三星 Gear VR 的云存储功用。
11:44:37 云技能 企业公共云存储布置仍处于前期阶段 多年来,企业对公共云存储的使用一直在稳步增加,但仍有很多IT部分处于该旅程的前期阶段。