AMD显卡将支持BFloat16浮点:AI性能飞跃

2019-10-23 寻子酱 电脑之家
浏览

GitHub开源社区最新公布的AMD ROCm开发库显示,AMD GPU将在未来加入对BFloat16(BF16)浮点指令的支持,相比现在的FP16浮点可带来巨大的飞跃。

目前,Intel Cascade Lake至强、Ice Lake酷睿处理器已经支持BF16,ARM下一代ARMv8 CPU架构也会加入。BF16虽然不属于IEEE标准规范,但它的优势正得到越来越广泛的验证和认可。

BF16可以视为精简版的FP32单精度浮点指令,使用8个有效位、8个阶位,内存和带宽占用减半,执行效率大大提升,同时又在性能方面远胜FP16,可以大大提升AI人工智能、ML机器学习、DL深度学习等应用的性能、效率,不再受限于FP16的性能、FP32的效率。

根据模拟,BF16相比于FP16带来的性能提升在不同运算类型中,少则可达1.6倍,多则能够超过4倍。

现代3D游戏渲染不太可能从BF16中获益,但是随着GPU越来越多地参与AI、ML、DL运算,BF16的加入必将会给AMD显卡带来强大的加成,未来值得期待。