发布时间:2024-08-04 来源:电子工程专辑
电子工程专辑讯 近日,特斯拉得克萨斯州超级计算集群被命名为“Cortex”。 在社交平台上,马斯克提到得州超级工厂的超级计算集群被命名为“Cortex”,并指出他刚刚完成了新设施的演练。8月4日凌晨,马斯克称,刚刚参观了 Giga Texas(又名 Cortex)的特斯拉超级计算集群。这将是约 100k H100/H200,具有大量存储空间,可用于 FSD 和 Optimus 的视频训练。特斯拉团队干得好!
得克萨斯州超级计算集群拥有约10万颗英伟达H100和H200芯片,用于训练全自动驾驶(FSD)和人形机器人擎天柱。
在4月的特斯拉第一季度财报会议上,马斯克表示,特斯拉在今年年底将把英伟达的H100芯片数量从35000颗增加至85000颗。
6月,马斯克被爆料称,将用于为特斯拉部署的 X H100 GPU 集群被用于X上,马斯克当时回应称,“特斯拉没地方把 Nvidia 芯片送去开机,所以只能放在仓库里。Giga Texas 的南扩建工程已接近完工。这里将容纳 5 万台 H100用于 FSD 培训。”
马斯克透露了今年从英伟达的采购额估计将在30亿到40亿美元之间。特斯拉今年在人工智能相关方面的支出约为 100 亿美元,其中约有一半是内部支出,主要是特斯拉设计的人工智能推理计算机、所有汽车上的传感器以及 Dojo。在构建人工智能训练超级集群方面,英伟达硬件约占成本的三分之二。
“Cortex”建成,特斯拉通过使用如此庞大的算力资源,能够加速其人工智能模型的训练过程,从而提升全自动驾驶系统的性能和可靠性,有助于推动特斯拉在自动驾驶技术领域的领先地位。该集群可以显著提高研发效率,使特斯拉能够在更短的时间内进行多次迭代和优化,加快新技术的开发和应用。
由于集群需要大量的电力来维持运行,因此也带来了巨大的能源消耗和冷却需求。为此,特斯拉可能需要投入数十亿美元用于购买和维护这些芯片,并且可能采用液冷技术以有效散热。此前,马斯克详细介绍了 Cortex 超级计算集群的巨大冷却需求,并解释说该集群今年将需要约 130 MW 的电力,未来 18 个月内更是有望突破 500 兆瓦。为此,特斯拉在计算机中心内安装了巨大的风扇和四个水箱进行冷却。
这个超级计算集群不仅对特斯拉有直接的技术和经济效益,还可能吸引更多的供应商和合作伙伴到得克萨斯州,通过持续的技术创新和强大的计算能力,特斯拉可以更好地应对市场竞争。
马斯克在得克萨斯州建立的“Cortex”超级计算集群不仅是技术上的重大突破,也是公司在未来竞争中保持优势的重要战略举措。