华为科大创新研讨会——新硬件驱动的存储创新

新硬件驱动的存储创新

主讲人:中科大 李诚

引言

System 的两大推动,其一便是新型硬件,有关计算、网络的革新。

从最开始的软盘->硬盘->闪盘->等等

存储技术日新月异

CPU 和网络的瓶颈体现在,新型硬件的出现,需要革新新的形式

  • 本地 DMA 频繁终端
  • 远程 RDMA 访问被阻碍,需要转换

异构计算

GPT3、Burt 等等深度网络的模型,参数都接近无限扩张,但是 GPU 的内存确是有限的,CPU 的?

CPU-GPU 异构

网络技术突飞猛进

带宽的增长,1GB 的市场占有率已经逐渐下降,上升的都是更高贷款的。

许多与网络相关的。

汇报提纲

  • 基于混合存储介质的单机键值数据库
  • on-GPU cache 与图神经网络训练优化
  • 基于分离式内存的云原生关系型数据库
    • 本地+远程组合内存,对用户“透明”
    • 用有限的方式实现近似无限的内存量

Sec 1

新的硬件设备,从 HDD -> NVME (Intel Optane)

然而我们“用不满”新硬件的性能

原因分析

从 User Space 的操作陷入 Kernel Space,中间耗费了太多时间,使用 SPDK,直接操作裸盘,就可以越过中间过程,直接体会到硬件的“快”。

代价

失去了文件系统的抽象,基于文件系统许多的特征/方法都丢失了,比如基于文件抽象的操作。

SpanDB Overview

Page cache 被保存下来,对写优化更加有用

Parallel logging vis SPDK

设计 pipe line,从而使得多个进程可以均摊。

拓展

  • 关于写日志的优化,可以运用到其他部分,从这一个小点引发的
  • 更加 general 的文件系统的设计,一些设计难点,比如保证文件一致性等等
  • 应用到多机/分布式可以联想到的问题,诸如网络的 latency 会弱化单机的优化等等