HPCAI

HPC - AI 在第一性原理分子动力学中的应用(中科院计算所)10^10规模

一块铁 10^22个原子

高性能计算每年翻一倍 = 超算规模 + Chip摩尔定律

但是由于分子动力学的方法是O^3, 问题规模增大,每一步迭代反而变慢了(2011年GB是3天一步)。

一百万内规模6次方内的专用机器 anton? ,比一般超算快100倍。

  1. 通讯精度压缩,
  2. 专用网络和通讯协议设计。

compute is cheap,memory and bandwidth are expansive, latency is physics.

18GB: AI图片处理大气模拟问题

AI : 高纬度函数的逼近(解空间相对于输入维度)

  1. 通过物理信息如何设计网络,来避免local minimal
  2. 其余技巧
    1. 10步AI,一步DFT
      1. 大哈密顿量矩阵的切片法,融合在纯粹的数据AI里。
    2. 预测误差

  1. 低精度相乘法,高精度相加
  2. 单精度相对于双精度
    1. 速度提升可能没有2倍
    2. 但是内存需求变成一半了,规模可以两倍

将epoch从几百变几个

字节量子计算机上的量子化学模拟 Dingshun Li

基于薛定谔方程和经典电子结构

digist + analog

量子计算的a killer app

当前问题:

  1. 量子规模 50~100
  2. 量子计算机运行时间有限
  3. 纠错机制还需要相位纠错
  4. 由于叠加态连续性,导致的误差

量子计算缺乏复杂度分析?

UCC Ansatz

需要进一步的研究学习

暂无

遇到的问题

暂无

开题缘由、总结、反思、吐槽~~

参考文献

HPCthreeLaws

Amdahl’s law

默认问题大小是固定的,导致最终可加速的倍率有上限

s是并行部分的加速比,p是可并行部分。

Gustafson’s law

默认问题总时间固定,比如串行时间a,并行时间b,并行部分加速就是核数n, 并行部分就是$F=\frac{a}{a+b}$。
$$执行时间=a+b$$
$$系统总执行时间=a+nb$$
$$S=\frac{a+nb}{a+b}=F+n(1-F)$$
意义在于,当并行部分较多时,加速比与核数成正比。

Sun-Ni’s Law

内存受限系统的加速比

这里的具体计算去看wiki

需要进一步的研究学习

暂无

遇到的问题

暂无

开题缘由、总结、反思、吐槽~~

参考文献