导言
在考虑workload priority时,FPGA是绕不过去的内容。这里了解一些基础
导言
在考虑workload priority时,FPGA是绕不过去的内容。这里了解一些基础
Workload Characterization & Priority & Scheduler to CPU/GPU/PIM
导言
姜师兄想研究不同计算硬件,或者是异构计算的适用领域。在调研时Davinci架构时,我感觉Domain-Specific Architectures是未来,这会导致会模糊CPU,GPU,PIM之间的区别。导致这个问题是在将来是伪需求
在完成了$A^3PIM$的工作后,其实利用了加速器(PIM)的调度的核心就是:
考虑数据移动和同步等负面开销后,来贪心最小耗时的策略。
但是对于这个复杂的问题,我的观点是 No silver bullet
Auto Free PT Download using RSS and Flexget
导言
导言
OpenCL 的模型和基础概念,感觉适合异构编程。
Huawei Ascend Domain-Specific Architectures : DaVinci
导言
明年就要入职华为了,还是要提前了解一下的
导言
Divide the bulky and outdated content about cuda runtime env into individual posts, ensuring both the thematic integrity and a balanced size for each blog entry.
导言
生产特殊的硬件:
常见的例子,用于并行计算的GPU, H265视频编解码单元, Google TPU芯片、车载芯片、手机AI芯片。
AI领域的至今不变的特点:
现在大火的transformer,除非它就是AGI的最理想模型,不然为一个模型专门定制硬件,很容易钱就打水漂了。为自己的算法模型定制一块AI芯片,如特斯拉。但应用面越窄,出货量就越低,摊在每颗芯片上的成本就越高,这反过来推高芯片价格,高价格进一步缩窄了市场,因此独立的AI芯片必须考虑尽可能适配多种算法模型。[^1]
当然,也可以从workload的应用出发,分析有什么重复的热点,值得做成专用的电路单元。
导言
理解当下最流行的开源text to image模型stable diffusion的基本思想。到Sora[^8]
Turing Machine & P versus NP problem
导言
在回顾数理逻辑的时候,又想起了NP问题,和NP完全的问题