盘算机体系软件顶会OSDI 2021最佳论文出炉,邢波团队研讨当选

2022-11-17 09:35:19 作者:垃圾又無趣
导读:计算机系统软件顶会OSDI 2021最佳论文出炉,邢波团队研究入选,机器之心报道机器之心编辑部来学习下 OSDI 2021 的最佳论文。OSDI(操作系统设计与实现研讨会,Operating Systems Design and Implem...

呆板之心报道

呆板之心编辑部

来进修下 OSDI 2021 的最佳论文。

OSDI(操纵体系设计与实现钻研会,Operating Systems Design and Implementation)是盘算机体系软件范畴环球最顶级的集会之一,被誉为「操纵体系道理范畴的奥斯卡」,拥有极高的学术职位地方,由 USENIX 主理。

USENIX 建立于 1975 年,早先名字为 Unix 用户群,其重要目标是进修和开辟 Unix 以及雷同体系,后该用户群改名为「USENIX」。OSDI 汇合了来自学术和行业范畴的专业人士,是探究体系软件的设计、实现和影响的主要论坛。

现实上 OSDI 所笼罩的范畴已经远远凌驾操纵体系。OSDI 是体系范畴和 SOSP 并驾齐驱的两个顶级集会之一,呆板进修经典框架 TensorFlow 最初便是颁发于 OSDI。是以 OSDI 的获奖论文对付想深入体系范畴的研究者来说是必读的。

第 15 届 USENIX OSDI 于 2021 年 7 月 14 日至 16 日线上进行,日前最佳论文等奖项已经连续颁布,共有 3 篇最佳论文,来自卡内基 · 梅隆大学(CMU)邢波传授的研究团队摘得此中一篇。我们来看一下这 3 篇最佳论文的详细内容。

最佳论文

论文一:MAGE: Nearly Zero-Cost Virtual Memory for Secure Computation

论文地点:http://people.eecs.berkeley.edu/~samkumar/papers/mage_osdi2021.pdf

宁静盘算(Secure Computation,SC)是指在单方和多方设置下,用于盘算加密数据的一系列暗码原语。只管 SC 越来越多地被用于种种行业应用,但在现实应用中利用 SC 的一个庞大停滞是底层加密的内存开销。该研究提出了一种新的 SC 实行引擎 MAGE,在内存开销分歧适的情形下也可以或许有用地实行 SC 盘算。研究者观看到,因为其预期的宁静保障,SC 方案素质上是不经意的(oblivious)即其内存访问模式独立于输入数据。利用此属性,MAGE 会提前盘算内存访问模式,并利用此属性天生内存治理打算。这种内存治理情势,可称为内存编程,是分页的的一种泛化情势,许可 MAGE 为 SC 提供一个高效的假造内存抽象。MAGE 的性能比 OS 假造内存体系超过跨过一个数目级,而且在很多情形下,运行分歧适内存的 SC 盘算速率与底层呆板拥有无穷物理内存来餍足整个盘算的速率险些雷同。

如下图所示,MAGE 的事情流程包罗两个阶段。SC 应用步伐是在 C++ 内部的 DSL 中编写的。MAGE 的 planner 将 DSL 代码睁开以天生字节码,然后对字节码实行转换来天生内存步伐。

MAGE 的 planner 事情流程分为三个阶段:结构、更换、调理。

论文二:Pollux: Co-adaptive Cluster Scheduling for Goodput-Optimized Deep Learning

  • 论文地点:http://www.pdl.cmu.edu/PDL-FTP/CloudComputing/osdi21-pollux.pdf
  • 项目地点:http://github.com/petuum/adaptdl

大多数现有调理步伐盼望用户为每个作业指定资源数目,这通常会导致资源利用服从低下。迩来,一些调理步伐关心用户选择安排给作业的资源,但却纰漏了重新优化深度进修练习,无法更好地使用所提供的资源。该研究提出的 Pollux 通过在 per-job 级别和 cluster-wide 级别自顺应地协同优化相互依靠的因子,进步了深度进修 (DL) 集群中的调理性能。

该研究同时思量了上述两个方面,并提出了一种名为 Goodput 的新指标,将体系吞吐量与统计服从相联合。通过在练习时期监控每个作业的状态,Pollux 模仿了在添加和移除资源时每个作业的 Goodput 改变。使用这些信息,Pollux 动态(重新)安排资源以进步 cluster-wide 的 goodput,同时敬重公正性并不停优化每个深度进修作业,以更好地使用资源。

在现实深度进修作业和轨迹驱动(trace-driven)模仿的试验中,相比于 SOTA 深度进修调理步伐,Pollux 将均匀作业完成时间淘汰了 37-50%,并为每个作业提供了抱负的资源和练习设置装备摆设。Pollux 基于对有效作业完成进度提出更故意义的权衡指标,来提拔深度进修作业竞争资源的公正性,并展现了在云情况降落低深度进修本钱具有新时机。

Pollux 的协同自顺应调理架构。

论文三:DistAI: Data-Driven Automated Invariant Learning for Distributed Protocols

论文地点:http://www.usenix.org/system/files/osdi21-yao.pdf

论文择要:漫衍式体系很难精确实现,重要缘故原由在于其不确定性。找到漫衍式协议的归纳稳定式是验证漫衍式体系精确性的要害步调,但纵然是简洁的漫衍式协议也必要耗费很长的时间。该研究提出了 DistAI,一个用于进修漫衍式协议归纳稳定式的数据驱动主动化体系。DistAI 通过模仿差别实例巨细的漫衍式协议并将状态记载为样原来天生数据。观看发觉,稳定式在实践中通常是比力简便的,DistAI 从小型稳定式开始,并枚举实用于全部样本的最强大概稳定式。然后,DistAI 将这些稳定式和所需的宁静属性提提供 SMT 求解器,以查抄稳定量和宁静属性的联合是否归纳。

从较小的稳定式和大概的最强稳定式开始,可以幸免大型 SMT 盘问,进步 SMT 求解器的性能。由于 DistAI 是从大概的最强稳定式开始,假如 SMT 求解失败,DistAI 也不必要抛弃失败的稳定式,会单调弱化这些稳定式,并用求解器再次实验,重复该历程直到终极乐成。

该研究评释 DistAI 可以或许找到「∃-free」归纳稳定式,假如存在该稳定式,则能证明在有限时间内存在所盼望的宁静属性。该研究的评估试验评释,DistAI 乐成地主动验证了 13 种常见的漫衍式协议,并在验证的协议数目和速率方面都优于其他常用要领,在某些情形下,它的速率凌驾其他要领两个数目级。

下图为 DistAI 的事情流程,从 IVy 的漫衍式协议范例开始,起首,DistAI 举行两阶段采样;其次,DistAI 举行罗列操纵;然后,DistAI 将候选稳定式提提供 IVy,IVy 要么乐成地将稳定式与所需的宁静属性联合作为归纳稳定式,要么失败并指出不可立的稳定式;最终,DistAI 实行单调优化。

精彩图集