首页 > 新能源汽车

特斯拉AI DAY的新畅想

来源:新能源汽车网
时间:2022-11-01 11:12:51
热度:

特斯拉AI DAY的新畅想在有限的硬件条件下,软件及算法方面的优化是否存在上限?在今年的AI DAY上,特斯拉给竞争对手们好好上了一课。赶在9月的最后一天,特斯拉AI DAY总算是

在有限的硬件条件下,软件及算法方面的优化是否存在上限?在今年的AI DAY上,特斯拉给竞争对手们好好上了一课。

赶在9月的最后一天,特斯拉AI DAY总算是“如期”召开,之前就有人猜测特斯拉会有很多新动作,而事实也的确没令人失望。尤其是开场的Optimus机器人惊艳亮相,更是激发了人们对于未来机器人的无限遐思。

不过,我们都很清楚,这台与《变形金刚》里擎天柱撞名的Optimus机器人只是一道垫胃的前菜。相比之下,特斯拉在自动驾驶技术方面的细节公布似乎更能满足所有人胃口。那么,此次AI DAY特斯拉带来的技术究竟能否让极客和科技大牛们饱腹呢?

Optimus抛砖引玉

实际上,早先就有消息透露,Optimus机器人采用了与汽车相同的自动驾驶计算机(以下简称FSD),这并非什么不可公开的秘密,但厉害之处就在于,它的行走、动作以及指令的执行均可通过AI模型来学习。这是什么意思呢?其实很好理解,特斯拉的工程师们早在一开始就把Optimus看作是一个人来训练,它可以像人类一样通过头部的摄像头来感知周围环境,并通过FSD视觉识别算法对周围环境进行分析,进而执行对应的动作。

为了适应人类生活场景并实现和人类一样的动作,Optimus也和人类一样拥有各种关节,尽管在舞台展示时它行走的样子有些步履蹒跚,但在学术界,这绝对是一个重大突破。而经过了训练,Optimus也就拥有了多种“技能”,比如浇花、搬运箱子等等。但是,想要让机器人拥有和人类一样的行动能力,那必然需要庞大的数据作为支撑,这也是马斯克预测Optimus需要至少3-5年才能量产上市的原因之一。

纯视觉≠降成本

不过,相比于Optimus机器人,特斯拉在自动驾驶领域的经验就丰富多了。公开数据显示,截至目前,全球参与FSD Beta版本测试的用户已从最开始的2000人发展为16万人,累计行驶里程也突破了4000万英里。而根据马斯克的表述,今年年底,FSD Beta测试的用户还将拓展至100万人,进而向1亿英里的累计行驶里程目标冲击。据马斯克透露,如果地方监管政策允许,今年FSD Beta版本即可在全球上线。

庞大的真实测试数据为Autopolit自动驾驶技术提供了强有力的数据支撑,而FSD完全自动驾驶神经网络上的进步则是此次特斯拉投下地又一枚重磅炸弹。与主流的融合方案(摄像头+雷达)不同,此次特斯拉选择在纯视觉方案上更进一步,根据特斯拉方面的消息,2022年10月起,北美、欧洲、中东地区交付的Model 3与Model Y都将不再配备超声波雷达。

2023年,Model S和Model X也将不再配备超声波雷达。此前,特斯拉已移除了自家车辆上的毫米波雷达,而此次的决策也意味着特斯拉未来车型的自动驾驶功能将仅依靠摄像头实现。尽管外界许多人看来这是特斯拉为节约成本而做的牺牲,但实际上这是特斯拉对于自家视觉算法的高度自信。

算法比算力更重要!

在AI DAY上,特斯拉再次提到了Occupancy netwrok(栅格网络)模型的应用和改进。你可以将其理解为一套基于BEV感知算法而建立的物体检测方案。因为在融合方案中有多传感器作为基础,所以计算机对于物体的判断会比纯视觉方案更简单。

不过融合方案的缺点也很明显,那就是需要将来自多传感器的时间进行同步(外参对齐),并且还存在着大量背景的储存冗余,继而会浪费掉许多算力,这也是为什么国内许多车企都在追求高算力芯片的原因之一。

而特斯拉基于Occupancy network改进的纯视觉方案则无需上述那些多余步骤,通过算法的优化,车辆可以在不具体识别障碍物是什么的情况下就做出避让,因此,纯视觉方案对算力的消耗更低,语义感知能力更强。

更简单的理解就是,同等算力下在面对复杂数据处理(高速环境或快速移动物体感知)时,纯视觉的Occupancy network甚至能够做到比激光雷达融合方案更出色。从2019年Autonomous Day公布FSD芯片开始,自动驾驶行业就进入了算力内卷的时代,国内车企纷纷配备NVIDIA、地平线等芯片公司最新研发的自动驾驶芯片,毕竟对于普通消费者来说,TOPS代表的数值对比起来更直观。

但需要注意的是,此时特斯拉就有了去掉雷达,走向纯视觉的想法,于是算法上的优化成为了这几年来特斯拉内部的主要攻坚。

在AI DAY上,特斯拉带给国内企业最大的启示就在于,原来在有限硬件条件下,软件以及算法上的优化竟有着如此大的作用,而对于国内企业来说,是不是也该将这个问题带入后续研发当中?或许在未来面临美方对于高端芯片的出口限制时,软件和算法将成为国内企业突破技术封锁的一大契机。

关于仿真与Dojo超算

视觉图像的仿真模拟是近年来计算机视觉方面的热门方向。在去年的AI DAY上,特斯拉就公布了一些关于视觉仿真在自动驾驶领域的应用案例,但是当时有许多人对这项技术提出了质疑,因为在人们看来,无论虚拟场景构建得有多真实都无法替代现实场景。

然而实际情况却是,虽然仿真无法保证做到对真实世界的100%模拟,但足以骗过AI。在一些实际有危险或极少发生的场景有独特优势,特斯拉可利用该方案来针对这些少见场景进行大量模拟,从而提高自动驾驶系统的通用性和稳定性。

不过,仿真的实现对硬件的带宽要求极高,也正是如此,截至目前,国内还没有一家企业真正将仿真模拟落地应用,这也再度体现了特斯拉在技术方面的先发优势。而AI DAY上提到的Dojo就是专门用来模型训练的超级计算机,其存在的目的就是为了帮助特斯拉快速且高效地制造大量仿真模型。

可以说,Dojo在设计之初就充分考虑到了上层算法软件的选型,首先,它没有一味的追求高算力,而是设计了大面积的片上静态随机储存单元(SRAM),尽管在容量上不及传统使用的动态随机存储单元(DRAM)高,但胜在带宽极高。

同时,特斯拉还优化了FSD芯片的整体数据流链路,进一步减少了电信号在芯片中的移动距离,让信号能够以非常低的延迟将模型参数和待运算的数据送入运算单元。

此外,为了进行大规模分布式训练,特斯拉还用了自研的Tesla Transport Protocol来保证数据传输的高效。为了证明这一点,特斯拉举了一个例子来说明Dojo的优化带来的收益,即使用24个GPU集群的服务器在计算一个BN(Batch_normalization)时的延迟是150μs,而25个D1芯片组成的Dojo训练服务器上,同样的BN仅需5μs,效率提升了整30倍。而在物理结构方面,特斯拉将多个运算单元和接口处理器组成了一个托盘(Tray),而Dojo的每个机柜都至少由两个托盘构成,这样算来,每个机柜都包含4248个核心,而由十台机柜组成的计算集群(Exa Pod)就拥有42480个核心,所以在同等数据中心空间内,它比传统的CPU或GPU超级计算机都要快上几个数量级。

另外,目前基于Dojo的训练服务器也取得了不错的进展。据特斯拉Autopilot研发总监Ashok介绍,在过去的一年里,特斯拉总计训练了75,000个神经网络,这意味着每8分钟就、要构建一个新的模型。在此次AI DAY上,马斯克还对外透露,预计在明年第一季度就可以对外交付以用于Auto Labeler训练的Dojo服务器,而届时,特斯拉的AI训练能力还将进一步得到提升。

自动标注与路线规划

在去年的AI DAY上,特斯拉就针对自动标注这项技术进行了详细介绍,而今年,特斯拉则着重分享了车道网络(Lanes Network)的自动标注。所谓自动标注实际上是在计算机制图技术发展基础上形成的一门技术。

其主要内容就是对地图信息进行标注,利用好这些驾驶数据更好地帮助自动驾驶系统对车道进行识别。每天,特斯拉的测试车辆能产生500,000条真实的驾驶旅程数据,随后交予AI分析训练,强化车道感知的能力,日积月累下来,特斯拉在车道感知方面的成就早已领先竞争对手几个代际。

从AI DAY上的分享不难看出,特斯拉FSD的车道识别已是基于3D Occupancy的感知,而不仅仅是基于2D的BEV,这也赋予了车辆识别车道高低起伏变化的能力。多车多旅途地图重建策略是该方案中的关键步骤,其基本逻辑是,不同的车辆对同一个地点可能有不同空间角度和时间的观测,因此将这些信息整合起来能够更好地对地图进行重建和标注,进而减少对高精地图的依赖。

或许纯文字的表述会让人有些难以理解,但实际的效果却是,当有新旅程启动时,这种通过自动标注的效果能够更好地适应低可见度(阴天、雨天、夜晚等路况)、遮挡等条件的能力,有时标注的准确性甚至会优于人工标注。

至于路径规划则是自动驾驶中另一个比较重要的模块,因此今年的AI DAY上特斯拉也进行了着重介绍,它们把采用的规划模型称为Interaction Srarch,即交互搜索。它主要由三个主要步骤实现:树搜索、神经网络规划和轨迹打分。

其中树搜索是自动驾驶轨迹规划中经常用到的算法,可以有效地发现各种交互情形并找到最优解。不过,用搜索的方法来解决轨迹规划问题遇到最大的困难就是搜索空间过大,例如在一个复杂路口可能有数十辆车,可以组合成超过百种交互方式,同时每种方式又可能有几十种时空轨迹作为候选,这会让风险评估和解优化花费更长的时间。

而在今年的AI DAY上,特斯拉则是为复杂路口的情况分析提供了新思路。这个思路很清晰。首先,特斯拉并没有采用轨迹搜索的方式,而是用神经网络来给一段时间后可能到达的目标位置经行打分,随后排除掉不切实际的候选路径,这样就会得到少量的较优目标。

与此同时,另一个神经网络会对行车轨迹进行规划,实现同时对多个候选目标的高度规划。随后再通过以上三个步骤的解耦,特斯拉便实现了一个高效且考虑了交互轨迹的轨迹规划模块。

尽管在学术界看来,多传感器融合方案优于特斯拉的纯视觉方案,但是以目前的技术水平来看,纯视觉的FSD无论是在通用性还是实用性方面都已然来到了行业最前端。

通过此次AI DAY,特斯拉把自动驾驶话题的热度推向了一个新高度,并且就信息量而言,其技术覆盖面之广,即便是在自动驾驶领域从业多年的专家、学者也很难快速消化。因此,称特斯拉的AI DAY为自动驾驶圈的“春晚”也不为过。

       原文标题 : 特斯拉AI DAY的新畅想