近日特斯拉(Tesla)举行的AIDay活动中,埃隆-马斯克(ElonMusk)及多位工程师,讲解了特斯拉纯视觉方案FSD的进展、神经网络自动驾驶训练、D1芯片和Dojo超级计算机等相关信息。其中特斯拉研发的AI训练芯片D1引起了不少人的兴趣,这款芯片将用于特斯拉目前正在构建的超级计算机,旨在以更少的消耗和更少的空间提供更高的性能。
据ComputerBase报道,D1芯片是采用7nm工艺制造的定制芯片,拥有亿个晶体管,其芯片面积为mm,小于英伟达的A(mm)和AMDArcturus(mm)。其配备了个训练节点,支持用于AI训练的各种指令,包括FP32、BFP16、CFP8、INT32、INT16和INT8。
特斯拉表示。D1芯片可以提供22.6TFLOPS的单精度浮点运算性能,BF16/CFP8的峰值算力达到了TFLOPS,热设计功耗(TDP)不超过W。对AI训练来说,可扩展性非常重要,因此通过带宽为10TB/s的“延迟交换结构”在各个方向进行互连。D1芯片周围会有一个I/O环,有个通道,每个通道提供Gbit/s带宽。同时25个D1芯片可以组成的一个训练模块,带宽达到36TB/s,BF16/CFP8的峰值算力达到9PFLOPS。
如果在数个机柜中部署个训练模块(包含个D1芯片),就能组成ExaPOD。这是世界上首屈一指的AI训练超级计算机,超过万个训练节点,BF16/CFP8的峰值算力达到1.1ExaFLOPS。相比特斯拉目前基于英伟达设备构造的超级计算机,在同样成本条件下,性能提高了4倍,每瓦性能提高了1.3倍,占地面积仅为五分之一。
目前排在第一的日本富岳计算机算力为2.15EFLOPS,而特斯拉之前的水平就达到了1.8EFLOPS,马斯克称这一次将是之前的10倍。换句话说,很多人觉得特斯拉只是造车,但现在马斯克却研发出了全球第一的超级计算机。这个计算机用来做什么?模拟大脑推动自动驾驶。特斯拉车上的8个摄像头,实时立体测绘周围环境,然后将数据传给电脑,同时发出指令,实现自动驾驶。这其实就和我们开车一样,也是眼睛看到周围环境,大脑处理图像,然后手脚给出响应动作。这一刻,也相信大家都明白了,为何特斯拉要坚持用摄像头而不用雷达,这台超级计算机就是马斯克的底气。
所以今天,我们应该看到,在新能源电池方面,国产确实开始追平特斯拉,甚至更加领先。但我们更应该看到,特斯拉的野心远不止于此。这也就解释了,为什么让马斯克在意的,并不是比亚迪、理想、蔚来,而是不造车的华为。因为马斯克真正的野心,是做未来汽车领域的高通、谷歌,而华为已经在未雨绸缪!