很多人会有一个误解,那就是特斯拉的电动汽车在运行全自动驾驶的同时也在进行机器学习。其实车载的硬件虽然运行速度很快,但是只能够将各种信息进行处理,然后做出决策。而真正让软件学会自动驾驶的是——特斯拉计算中心的超级电脑,它通过海量的驾驶数据使用机器学习来喂养神经网络,从而使得该神经网络具备驾驶的智能——AI。
当前特斯拉用来训练神经网络的超级电脑基于英伟达的GPU芯片,而未来特斯拉将会自建超级电脑——Dojo,到时候它可能成为全球最快的超级电脑之一。
什么是Dojo超级电脑?
在去年特斯拉的自动驾驶日上,CEO马斯克曾确认了Dojo超级电脑项目的存在。
“我们在特斯拉确实有一项重要计划,而今天我们没有足够的时间来谈论这个叫做“ Dojo”的计划。那是一台超级强大的训练计算机。Dojo的目标是能够获取大量数据并在视频级别进行训练,并使用Dojo程序或Dojo计算机对无数视频进行无监督的大规模训练。”
Tesla Autonomy Day
按照马斯克的时间表,Dojo有望在明年夏天可以提供服务。
Dojo源自于日语的“道场”,翻译成中文就是武馆——意味在这里进行“驾驶”的学习和训练。
特斯拉的汽车安装了8个摄像头,相比人眼通常只能看到前面,它可以“看到”的是一张3D的全景图像。加上时间这个维度它实际上“看到”的是一个3D的视频。目前用来训练神经网络的数据通常都是拼接起来的2D图片,并且需要人工在图片里面标识(Labeling)肉眼看到的物体,而Dojo要能做到的是进行“全3D场景,视频级别”的训练,而且要能够达到不用人为进行标识——这需要超大的算力支持。
8个摄像头
马斯克还发推文提到,Dojo将使用特斯拉自行开发的芯片和计算机架构,它将被专门用来进行神经网络训练,算力能达到exaflop,也就是说它每秒能进行10的18次方32位浮点运算,这个算力将可以跻身全球最快的超级电脑之列。
目前全球最快的超级电脑是富士通开发的——富岳超级计算机,它64位浮点的计算速度为0.415 exaflop。
富岳超级计算机
为什么要自行开发Dojo超级电脑?
特斯拉目前用来训练神经网络的超级电脑基于的是英伟达GPU芯片。
不过就像特斯拉在车载电脑上放弃了英伟达的Xavier芯片,而是自行开发了FSD芯片一样,在训练神经网络的超级电脑芯片上,特斯拉也将自行开发芯片。
特斯拉车载FSD芯片
原因主要是外购的英伟达芯片不能满足特斯拉的需求。
一方面英伟达生产的芯片不光卖给特斯拉一家,所以不可能完全按照特斯拉的需求进行优化;另一方面,英伟达芯片无法满足特斯拉在自动驾驶领域的创新速度。
除了英伟达之外,谷歌也有自研的人工智能芯片——TPU(张量处理器),但是考虑到谷歌下属的Waymo在无人驾驶方面和特斯拉是竞争关系,所以应该不会销售最好的芯片给特斯拉,所以特斯拉只能自己搞。
要知道,想要训练神经网络,需要海量的数据来喂养——目前特斯拉有超过30亿英里的实际驾驶数据——基于英伟达GPU芯片的超级电脑完成一个训练模型大概需要72小时,也就是整整3天专注于一个模型的训练,而Dojo所要做到的是使得训练速度至少可以提高一个数量级,也就是10倍以上。也就是说将完成一个训练模型的时间降低到7~8个小时,这样一天的时间可以进行3个模型的训练。极大的加快了训练的速度。
除了目前已有的驾驶数据,特斯拉还有超过1百万在路上的汽车,随时向超级电脑提供实际驾驶数据。来自于全球各地的不同路况的信息使得神经网络有机会批量学习到极为罕见的场景,并做出判断。而这是很多通过模拟环境来进行机器学习的厂家所不具备的能力。
特斯拉舰队
结语
当然特斯拉自行开发也不是什么新鲜事了,在另外一个关键技术——电池上,特斯拉也选择了自行研发和生产电池。其动因也是因为电池创新进度太慢,无法满足特斯拉的需求。所以结果就是特斯拉在很多关键技术上都实现了自研和把控,进一步地垂直整合,而不用等待这个领域的公司发展起来进行配套整合,从而保持领先优势。
就像马斯克所说,最好将特斯拉视为一串由十几个不同的初创公司组成的公司,现在看来,超级计算机初创公司就是其中之一。
撰文:罗峰
出处:头条号 @GAFATA投资实战