AI Model Design Effectiveness

导言

作为非AI从业者,而是(即将成为)HPC赋能AI的工作者。我一直在思考,我对AI模型的了解应该止步于什么程度?

从AI模型设计的有效性角度切入,应该是我的学习的Sweet Spot / tradeoff。

意义:明白哪些层和哪些参数是有效的,对于模型压缩(模型裁剪,权重剪枝)来说是必要。远比算子融合等带来的提升大。

有待了解的内容:

  1. 相对于领域的复杂的信息量,一个十层的模型竟然能将其表达,Miracle!
  2. 有研究表明模型的参数大部分都是无用的,如何判断,如何剔除。
困惑:如何证明网络是学习或存储了真实世界的内在关联,而不只是通过增大了训练数据量和参数而存储了问题的答案。(使用测试集的准确度来量化)

AI的现状/困境: 
1. AI研究人员,由**具体问题场景**出发,利用已有的工具或者特殊设计网络来**拟合/建模**问题,尝试提取不知名的隐含的特征到网络中,来解决这一类问题。
2. 明显的缺陷:就是不可重复性,缺乏一个模型来统一描述世界的问题,每个问题都要单独设计。

对象:transformer, gpt, stable diffusion(先看效果,在看是否成熟到值得学习,之前生成的多指图简直是精神污染), YOLO。
Read more

Classical AI Models

导言

机器学习和人工智能模型算法,从一开始模仿神经元设计,到现在根据任务定制或者基于naive的思想构建(例如对抗思想、感受野、注意力机制)。模型的设计可以说是日新月异,截然不同。但是从高性能计算的角度来看,还是离不开求导操作、矩阵操作、激活函数计算这几点。剩下值得考虑的就是寻找现有或者未来模型构成计算操作的最大公约数,来对其进行特殊软硬件设计加速。或者只是对现有模型的适配加速工作。

Read more

HTML

导言

learning HTML is the foundation of building my hugo theme

Read more

Salary & Tax & Insurance

导言

毕竟都是要工作的人了,有些💴相关的事情还是要了解的。 计算税率有几个难点:

  1. 计算每月累计的,和全年计算方法的不同。
  2. 预交款和退税怎么算?6万是5000*12. 但是预交款不扣吗
Read more

When & How 4 team presentation page & knowledge database pool

导言

我原本是想开发一个实验室主页的模板的,一开始想着还可以带到公司里去。但是我突然想到 公司里还有 “嫡系” 这种事情。让我意识到实验室和公司的环境完全不一样,让机制的部署和落地变得更加复杂。

Read more