2019年05月20日 星期一
当前位置: 首页  学术讲座

微软AI讲堂【浙江大学站】-云中的灰天鹅:重新定义大系统可靠性

编辑:综合办公室来源:人工智能省部共建协同创新中心(浙江大学)中文网时间:13:52:54访问次数 : 16

    摘要:随着基于云服务的普及,云计算系统已经成为社会赖以生存的关键基础设施。其超大的规模和极高的复杂性给系统的可靠性带来了很大的挑战:传统的基于共识协议和容错技术的方法已无法保证让云系统免于灾难性故障。通过对运营中的云服务错误的分析,我们定义了灰色错误并发现云系统中的灰色错误---“云中的灰天鹅”---是导致云系统异常和宕机的关键原因。我们以我们最近的研究来展示如何基于这些新的发现来重新审视和定义大系统可靠性的根本原则、方法学和实践。最后,我们会介绍微软亚洲研究院对系统和网络未来愿景的展望以及我们尝试塑造未来计算的研究和探索。


    周礼栋博士现任微软亚洲研究院副院长,负责领导计算机系统和网络方向的研究团队,主要从事大规模分布式系统、存储系统、无线通讯和网络,以及系统安全和可靠性方面的研究。曾任职微软硅谷研究院研究员、微软亚洲研究院和微软雷德蒙研究院系统研究组首席研究员。他的研究一直推动着可信计算及可扩展分布式系统的理论和实践进步,为在线云服务提供支持,与此同时,他还对实时部署的大规模服务做出了重要的技术贡献。周礼栋博士是电气与电子工程师协会会士 (IEEE Fellow), 计算机学会计算机存储会刊(ACM Transactions on Storage)编委会成员,曾担任国际顶级计算机系统会议的程序委员会成员,第一届亚太系统研讨会APSys)程序委员会联合主席,以及201726届操作系统原理大会(SOSP’17)联合主席。周礼栋博士毕业于复旦大学,并获得了计算机科学学士学位,之后在康奈尔大学深造,先后获得计算机科学硕士及博士学位。

Copyright @ 2019 人工智能省部共建协同创新中心(浙江大学) 版权所有 技术支持 : 创高软件 管理登录