9月初,美国加州通过了一项新法案:禁止特斯拉在辅助驾驶系统广告中使用“自动驾驶”等词语。美国今年至少有几起死亡事件与特斯拉辅助驾驶系统Autopilot有关,自动驾驶技术的虚假广告有可能引发严重的安全问题,而2022 AI Day上,特斯拉FSD自动驾驶依然是重头戏。

10月1号,特斯拉在美国加州举办2022 AI Day活动,本次发布会特斯拉首次亮相Optimus人形机器人,并展示了FSD辅助驾驶和Dojo超级计算机的最新进展,我们今天重点来看看特斯拉FSD的最新进展,因为人形机器人也用到了FSD的类似技术。

最新FSD能2D变3D,克服静态物体?

之前我们文章中提到过,目前参与FSD Beta版本测试的用户已从2021年的2000人扩大至16万人,并且有可能在明年达到百万用户一起测试。在这一年之内,特斯拉自驾团队已经测试了7万5千个软件模型,并且发布了多达281个模块,更新了35个版本。这一年左右的更新,主要围绕着一些细节场景的优化,比如无保护左右转等。

在最新的FSD版本上,特斯拉将提升交叉路口转弯的决策优化,通过更复杂场景中路面行人和其他车辆的轨迹的研究和模拟,提升决策的安全性和舒适性,并在100毫秒内作出决策。

其中最重大的更新,就是上个月发布的Occupancy Network,直接在神经网络中完成2D的图像平面到3D的BEV空间的变换,提升了多摄像头感知下的准确性和稳定性。今年,进一步将整个闭环流程优化。工程师透过视频来训练计算机,实现可以自动Label模块,可预测物体轨迹,计算出最佳路线,而运算时间只需要10毫秒。

我们在网上看到过不少特斯拉自主躲避碰撞的视频,这一次特斯拉首次展示出了自己的“避障方案”。

这是特斯拉依靠车身上的8颗摄像头,输出的3D占据网络,目前大多数自动驾驶公司的思路都是通过激光雷达、毫米波雷达甚至是4D成像毫米波雷达来扫描构建3D世界,但上文我们提到了特斯拉用2D平面转变为3D世界。

虽然看上去画面很粗糙,但其实其位置精度很高,而且每个物体都是含有语义信息的,视觉的精准程度还是不能精准成像的雷达系统所比拟的。通过这样的视觉占据网络,特斯拉FSD能够摆脱曾经“先识别再感知”的过程,像之前那种遇上不认识的物体直接撞上去的事情,今后会越来越少下一版的 FSD 有望提升障碍物避让的泛化能力。

场景优化更为细致,但亮点其实不多

想要用纯视觉实现 3D 占据网络,最大的难题在于对海量数据的标注处理,虽然特斯拉依靠百万辆的搭载量,已经获取了数量庞大的数据集。

FSD Beta的车道模型也跟以前大不相同,大部分的车道模型是根据道路上的标线而来,因此对行车环境有要求。但FSD Beta的车道,不仅有标线,还可以依据现场环境自动绘制出的合理行车路线,这一点其实有些类似于之前我们提到过的比亚迪在无车道线的时候,依据周边车辆的距离,进行自主的车道居中保持功能。

特斯拉展示了在十字路口,FSD Beta现在可以标示每个车道的起点、中间点和终点,即使路口没有转弯标线,计算机也能掌握车辆合理的行车路线,通过动态预测完成高难度的开放路口左转。

特斯拉还介绍了FSD在为用户进行决策时使用的方式,以及收集数据对改进自动驾驶算法的作用,并解释占用及其在3D映射和提供汽车鸟瞰图方面所起的作用。目前,FSD Beta的深度神经网络达到100万参数,15万+神经网络层,37.5万个连接。可以在5分钟内模拟出现实中未出现的场景。

自研训练芯片,比英伟达芯片更强?

面对数十万的测试用户所产生的巨大的数据量,特斯拉后台的超算中心自然也不会弱,为了提升训练效率,特斯拉还自建了超算中心Dojo,并为此自研了训练芯片D1,没错,就是在自研了自动驾驶FSD芯片后,又自研了自动驾驶训练芯片。

D1芯片还使用了前沿的“晶圆封装技术”,将25个D1芯片直接封装在整个晶圆上面,每个Dojo ExaPod集成了120个训练模块,内置3000个D1芯片,拥有超过100万个训练节点,算力达到1.1 EFLOP(每秒千万亿次浮点运算)。

单片芯片性能超越了英伟达的A100和H100芯片,在与英伟达A100的对比中,特斯拉的工程师给出了 Dojo 和英伟达A100在跑经典图像分类模型ResNet-50时的结果,Dojo可以实现比A100更高的帧率;而跑神经网络模型 Occupancy Network时,Dojo的性能倍增;最终的目标是4.4倍于A100的单芯片训练速度,和更低的能耗、成本。英伟达的黄老板估计很快就会做出回应了。

特斯拉在凡事都靠自己这条路上确实是越走越远,这与其全球车企市值第一的地位,以及有一个志向不在地球的老板有密不可分的关系。

Model 3 参数 图片 )价格的一半,就能拥有机器人同事?

这一次,其实更受人关注的是首次亮相Optimus人形机器人,相比之前的概念版,原型机看起来十分粗糙。没有外壳、涂装,零件也完全裸露,就是为了让它一丝不挂的,把最本真的一面展示给大家。

Optimus 使用了一颗特斯拉自研的 SoC 作为其智能中枢的关键组件,支持 WiFi 和 LTE(4G)网络连接。考虑到机器人身处的场景与汽车的巨大差异,无线网络、音频输入等支持,是保护人类用户和 Optimus 双方安全的必要组成,它的视觉感知系统类似于FSD的感知,目前还不知道它的具体感知逻辑,估计是比人类感知更加强大。

Optimus擎天柱的传感器、控制系统全部整合在躯干上,全身拥有28个关节驱动器,完成200个以上不同角度的动作,最重要的手部,拥有6个驱动器,可以完成27个角度动作,可以负重10公斤并精准抓握小型零件。

在Optimus的腹部躯干,装有一个2.3 kWh的电池,足以提供它一整天工作所需电量,目前Optimus功耗并不大,静坐时功耗约100瓦,慢走时功耗约为500瓦。

未来3至5年内Optimus的开发就能成熟。在特斯拉机器人业务达到数百万台的量产规模时,其单台售价将会大大低于汽车,预计价格将不会高于每台2万美元,差不多是特斯拉Model 3标准续航升级版4万美元单价的一半。

想象一下,开车不用人为干预,办公伙伴还是机器人,你还需要做什么?

总结:

马斯克在社交网络上说,这次活动的目的是招聘人工智能和机器人领域的工程师,开了个秀肌肉的大会,其实是一场招聘宣发会。

特斯拉的AI Day几乎从来都不是PPT大会,而是用真材实料打动每一个人。面对这样的企业,我们也不能完全地只惊叹于这些技术,更要思考这些技术一旦全部付诸实际后,我们人类自身又会是怎样一个地位呢?