Bilibili Video Downloader

The easiest way to download Bilibili video without watermark or logo

【卢菁老师说】又遥遥领先?华为昇腾真能平替A100?

TIP! Right-click and select "Save link as..." to download.

VIDEOS
MP4 N/A 480P Download
MP4 N/A 480P Download
MP4 N/A 360P Download
MP4 N/A 360P Download
AUDIO
MP4 N/A mp4a.40.2 Download
MP4 N/A mp4a.40.5 Download
MP4 N/A mp4a.40.2 Download
THUMBNAILS
【卢菁老师说】又遥遥领先?华为昇腾真能平替A100? JPEG Origin Image Download
最近,许多媒体都在报道华为的GPU已经能够与英伟达的A100相媲美。

虽然华为没有公开宣布其具体参数,但有消息称华为的GPU峰值算率已经达到甚至超越了A100的312 Tflops2。
因此,从账面数据来看,华为的AI处理器可以在较大程度上代替A100。
但是真的是这样吗?

2018年华为发布昇腾310和910
那么其中呢310用于推理,910用于训练
前者是针对
移动设备和边缘服务器打造的
而后者呢是针对数据中心打造的
背后的核心技术
就是达芬奇架构

这一架构横跨所有计算设备,包括数据中心和无线耳机等。
。这种架构的采用使得麒麟芯片在AI计算方面具有强大的性能。
此外,达芬奇架构的灵活性也使得它能够适应不同类型的计算需求,从而在各种设备中发挥出最佳的性能。

下面我们具体说说用于做训练的昇腾910系列
关于昇腾910系列的具体信息
其实是比较隐蔽的
华为其实并没有去公开宣传它的
一些具体参数
而相比英伟达
你很容易找到A100的详细技术文档
而关于昇腾910的性能呢
说实话目前很难获取真实的参数啊
从华为官网上查到的当年数据上看,910的三个系列A,B,和ProB
在2018年,性能上都是不如A100的
那么根据今年(2023年)科大讯飞透露的消息啊
910B如今已经可以对标A100
那么这就意味着910系列的峰值算率
已经达到甚至超越了A100的312 Tflops
这是否可以说明在2019年之后
华为不但没有停止昇腾系列的研发
同时也像麒麟9000s一样
克服了生产问题
现在可以肯定的是
910系列还在对标英伟达2020年的产品
但即便如此呢
无论是A100
还是被阉割了互联速率的A800
其实都有了国产平替
至少从账面数据来讲的话
910是可以在较大程度上代替A100的
为什么说是较大程度上呢
而不是说完全代替甚至超越
这个是因为A100支持的数据类型呢
其实要更加的丰富
那么其中有专门的TF32,BF16等AI专用的数据类型
这意味着A100有可能更灵活
效率更高一点
那么此外呢,有时候我们不能只单独看一块芯片
一个AI芯片其实一般不会单独使用,
特别是在训练大模型的时候往往
是被组合成集群
那么片间互联的能力
以及计算模组与CPU
和外部服务器之间的互联能力
也直接影响了AI训练的整体效率
在这方面呢英伟达有NVlink协议
华为也有一个HCCS协议
但是HCCS最高的带宽只有400GB
也就相当于是A800的水平
而满写的A100是600GB
那么另一方面呢
HCCS啊最高支持四路互联
也就是四块GPU互联
而英伟达的Nvlink呢
可以支持8块GPU的互联
还有一点呢
就是英伟达在A100上
引入了稀疏计算
相当于是忽略矩阵中一些
为0或者接近为0的数据
来提升计算速度
这一点在当前流行的大模型上表现更加明显
那么一般在稀疏计算下
这个英伟达GPU的算力呢会翻倍
而实际上华为他也有类似的
模型压缩算法
但是具体具体的提升
暂时是不知道的
当我们从一个集成了数百张
上千张卡的集群计算机角度来看的话
英伟达是会占据一些优势的
关于国产昇腾芯片你怎么看呢? 欢迎评论区讨论留言