华为-中国科大计算网络联合创新研讨会

实验室运行状况

数据中心存储,数据访存优化。

模式:南研所提供经费支持,科大和南研所共同进行前期调研和探讨,进行立项,专家委员会对项目进行评审。

许团队介绍

KV 存储的优化,写放大优化,范围索引

容错存储与纠删码(EC),设计并不多,主要在项目中具体实现,部署的细节关心较多。

华为专家分享

DCN 三张网络:服务器云(网络)、存储/计算网络

共识趋势:网络带宽的发展> CPU 核心

闪盘:华为设计 800 微秒(原来)->设计 100 微秒(现在)->赈灾设计<20 微秒(闪盘压榨极致)->考虑 SCM(类似 NVM?)个位微秒

计算 IB 网络<->以太网

以太互联与 IB 互联。

基于应用的流量建模与优化

科大一方,主要是超算计算中心(网络计算中心下属部门)

主要用户:科大校园理工科

典型超算系统逻辑架构

分析的典型应用 VASP,分析的方法:

  1. 抓包程序 次/5s
  2. 修改 OpenMPI 源代码,在 MPI 中加入一些日志相关的代码,比如记录函数调用时间 blabla

所以许老师的疑惑,有没有定量研究到某个限度?

超算应用特征在网计算

VASP 流量特征

openFOAM 流体力学的超算应用

  • 第一性原理计算

Q:是不是其他应用也会得到相似的结果,比如 Allreduce 占比最多,还是说不同的应用会分为几类。

基于容器网络的服务模型映射

坤哥分享

应用分析,

容器扩缩容,需综合多维资源,

K8S 调度研究

K8S 容器调度前期调研,配置环境,监控系统等等。

多副本与分布式数据库前期研究可以借鉴的研究思路:

  • 容器这一层做优化,有没有可能在应用上做

总结