泛读笔记:《Towards Optimal Transaction Scheduling》


Paper

摘要

最大化事务吞吐量是高性能数据库系统的关键,高性能数据库系统关注于最小化数据访问冲突以提高性能。然而,找到有效的时间表,减少冲突仍然是一个悬而未决的问题。为了提高效率,以前的调度技术只考虑可能的时间表的一个小子集。在这项工作中,我们建议系统地探索整个时间表空间,主动识别有效的时间表,并在执行过程中精确地执行它们,以提高吞吐量。我们引入了一个贪婪的调度策略,SMF,有效地找到快速的时间表,并优于最先进的搜索技术。为了实现这些时间表在实践中的好处,我们开发了一个时间表优先的并发控制协议,MVSchedO,执行细粒度的操作顺序。我们在我们的系统R-SMF(RocksDB的修改版本)中实现了这两个功能,在一系列基准测试和实际工作负载上实现了高达3.9倍的吞吐量增加和3.2倍的尾延迟减少。

阅读文章 +

泛读笔记:《dLSM: An LSM-Based Index for Memory Disaggregation》


Paper

摘要

新兴趋势内存分离(memory disaggregation)将CPU和内存物理上分开,并通过超快的网络(如 RDMA)连接。这使得计算(CPU)和主内存可以弹性地独立扩展。本文研究了如何在内存分离架构中高效设计索引。虽然现有的研究已对B树进行了优化,但其性能仍然一般。本文重点关注基于LSM树的索引,并提出了dLSM,这是首个针对分离内存高度优化的LSM树。dLSM引入了一系列优化措施,包括减少软件开销、利用近数据计算、针对字节寻址进行调优,以及以RDMA为例进行的定制化实现,以提升系统性能。实验结果表明,dLSM的写入吞吐量是优化后的B树和四种现有LSM树索引在分离内存上的适配的1.6到11.7倍。dLSM使用C++编写(约41,000行代码),并且是开源的。

阅读文章 +

泛读笔记:《The Case for Distributed Shared-Memory Databases with RDMA-Enabled Memory Disaggregation》


Paper

摘要

内存解耦(Memory Disaggregation,简称MD)通过将计算(CPU)与内存分离,允许数据中心设计实现可扩展性和弹性。在MD架构下,计算和内存不再被耦合到同一个服务器中,而是通过诸如RDMA(远程直接内存访问)等超高速网络相互连接。MD带来了许多优势,例如更高的内存利用率、更好的独立扩展(计算和内存的独立扩展)以及更低的拥有成本。分布式共享内存数据库(DSM-DB)潜力巨大。本文列出了构建分布式共享内存数据库将会遇到的挑战。

阅读文章 +

CMU15-721 Note4 | Query Execution & Processing I

阅读文章 +

CMU15-721 Note3 | Data Formats & Encoding II

阅读文章 +

CMU15-721 Note2 | Data Formats & Encoding I

阅读文章 +

CMU15-721 Note1 | Modern OLAP Database Systems

阅读文章 +