自动驾驶是集大规模工业生产、软件开发、智能计算的综合系统产品,是人类迄今为止面对的最复杂系统工程。这主要在于应用场景的复杂度、巨量交通环境变化下的随机性和不可穷举,交通参与者意图的不可预测性和对自车行为的精准控制。
智能驾驶的行业参与者们为了解决上述挑战,给用户体验带来真正的提升,对算力、算法的发展寄予了更大的期待。而通过前沿公司的观察,或许我们可以管中窥豹,一探自动驾驶的落地趋势与方向。近日,地平线副总裁兼软件平台产品线总裁余轶南博士将自动驾驶挑战具体归纳为以下四点——
1.随机性。道路动态目标的意图完全无法判定、预估。
2.不可预测性。如临时出现的鬼探头、突发事故或极端天气等
3.无限的长尾场景。90%的道路环境数据极其容易被获取,10%黄金长尾数据仍需在很长的周期持续收集。
4.多方动态博弈的交通参与者。道路中存在多个目标同时运动,可能性无限扩散。
而围绕这些挑战,余轶南博士给出了“回归用户价值,以高效计算引领智能驾驶普及”的观点,并从大模型趋势、计算架构演变、算力发展、算法特征给出了自己的解释。
端到端的自动驾驶算法趋势
近几年,自动驾驶行业已从最初的模块化开发(包括感知、定位地图、规划、控制等),越来越快地向端到端的基于BEV+Transformer架构发展,所有传感器信号被接入到一个巨大神经网络里,而这种神经网络可直接输出整个车辆规划到控制器去做轨迹跟踪。
比如最近一年业内火热的的BEV,可以实现整个道路动静态几乎所有要素的感知,包括车辆、行人等常见动态目标及路面静态的要素,并识别要素之间的关联关系,过去神经网络无法单独完成,需要集合高精地图,但今天基于Transformer架构,可以非常容易识别。此外,还能对所有道路参与者做目标轨迹预测,使车辆始终拥有安全余量。
而端到端大模型算法的实现则需要有效的算力支撑落地,因为这类算法落地的场景基本为城市场景的自动驾驶,需要实现多种复杂场景的计算,如复杂拓扑结构(十字路口等)下的无保护左转、无保护右转路径/时间选择、快慢车道拥堵博弈匝道汇出、停车下客规划避让等等。
新闻稿】回归用户价值,地平线以高效计算优化自动驾驶体验898.jpg"/>
地平线征程5实现城市NOA典型场景
大模型应用和参数规模暴涨要求更高的算力
随着更加端到端的模型的采用,代码量增加相对缓和,相比模型参数持续下降。另一方面,模型参数的增长速度和算力相关,更大算力就可以使用更大模型。
眼下,行业普遍算力大概在亿级别这个规模,足以支持像BEV+Transformer的架构,可初步实现智能驾驶体验,但这还not good enough。模型规模的提升,在云端可以依靠更多显卡或通用计算的芯片实现,但在车端则是一个巨大的挑战,因为意味着需要在有限的面积、有限的功耗及有限的成本下,去实现更大的算力。
大规模的应用和参数规模的暴涨对自动驾驶系统提出更高要求
为此,地平线打造出专为智能驾驶设计的BPU架构,有望在未来几年能做到一至两个数量级的有效算力提升。凝聚着对深度学习和算法趋势的前瞻洞察,地平线BUP已经过三代架构迭代验证。基于最新一代的BPU架构贝叶斯的芯片征程5,已伴随着理想L8、L7的大规模交付获得了巨大成功,实现了行业领先的高速NOA功能。
地平线本次车展发布了最新一代纳什Nash架构。架构的命名致敬了约翰·纳什JohnF Nash,这位提出“纳什均衡”博弈论的数学家、经济学家。顾名思义,这一代纳什Nash架构聚焦于支持整个交通场景下博弈能力的计算。新架构全面大幅提升了环境感知、要素关联关系、行为预测能力,可支持大规模Transformer、类GPT网络结构,及蒙特卡洛树搜计算能力,并现实了诸多底层硬核技术的突破进展。
最新一代纳什Nash架构发布
•支持了三级存储架构,能灵活分配大算力资源,可一部分用于整个端到端自动驾驶,另外一部分可以用于做端上的大语言模型。目前业内大语言模型基本上都在云端才有算力足够实现,但是下一代架构面可实现在端上支撑大语言模型或大规模Transformer的能力,在端上就能对话。这对于智能汽车来尤为重要,因为其上有非常多用户的视觉图像、语音隐私的需求。
•数据驱动的功耗优化。一般而言,随着算力越来越大,制程越来越小,其功耗就会越来越大。而随着芯片功耗不断增大,散热会成为巨大问题。Nash架构使用数据驱动动态调整能耗分配,针对神经网络动态范围特性,降低了30%功耗,取得了巨大提升。
总而言之,Nash架构的超异构计算核心增强了算力的多样性,可支持丰富计算算子,具有通用可编程性,并拥有最佳的算力效率,同时AI辅助设计大幅度提升了可编程性。
端云协同,加速智能驾驶演进
端上算力提升很重要,还要有更高效的算法,更大数据的吞吐力、计算能力。此外,云端的基础设施建设也不容忽视。目前,地平线已经搭建了一个拥有近20亿次/秒算力的计算平台,达到90%的4D标注自动化、百万公里/天的数据仿真能力。
根据品牌十年愿景及行业的整体发展预期去规划,未来地平线将把算力规模提升40倍以上,4D标注能力提高到99%的自动化率,仿真测试能力提升一万倍,达到百亿公里/天。
关于自动驾驶,行业内一直有Robot学派与AI学派之分。对此,我们非常确信在10年内,自动驾驶的技术会从现在的分阶段范式走向对物理世界的统一表达,通过对世界的多样性的建模,能够产生含有世界知识的驾驶模型。
在诺贝经济学奖得主卡尼曼的《思考,快与慢》一书中,把人类的思考模式拆分成System1本能快系统和System2认知慢系统,分别代表依赖直觉的、无意识的思考,和需要主动控制的、有意识进行的思考系统。
这套逻辑非常类似自动驾驶系统面对的场景。比如,开车弯道时更倾向于走最外侧,这是一种慢系统的认知。而突然面对前方出现一个人或车,一脚刹底,这种本能近似于快系统的本能。通过认知慢系统和本能快系统的结合,也就是Robot与AI的结合,将打造出自动驾驶最终的完整系统。
地平线还将持续向行业去提供先进的算法,高效的端上算力以及大规模计算平台。为此,地平线正式面向所有的Tier1或者OEM合作伙伴,推出了嵌入式应用开发套件——踏歌®(TogetheROS™·Auto),该套件可将开发、集成、验证效率提升200%。
踏歌®(TogetheROS™·Auto)
算力与算法发展并重,系统支撑用户体验优化
面对过去几年行业中的L2与L4路线之争,地平线认为眼下乘用车市场正处于ODD(Operational Design Domain运行设计域)扩展周期内。2023年开始,已经有城市NOA陆续落地,意味着全场景自动驾驶的开启。从现在到未来的十年,行业会处于MPI的迭代周期中。在这个周期内,只有一个强竞争指标全场景MPI,其他都是入门级指标。而这一过程需要算力、算法并重发展才能加速落地,对于地平线而言,对两者的重视与融合则体现在BPU架构的持续升级与能力突破上。
地平线会持续向行业去提供最先进的算法和开发平台,推动自动驾驶的关键指标MPI的平均水平,在未来五到十年,提高到现在的1000倍。地平线期待联合所有合作伙伴一起推动MPI的发展,让人类生活更安全、更美好。因为,以人为本,技术的价值不在于让机器更伟大,更在于让人更伟大。
未来的十年行业处于MPI迭代周期
过去几年,不管是芯片、软件还是智驾系统,地平线都经过了市场的充分验证。目前,已有超过120款合作车型前装定点、超过50款合作车型量产上市,征程5的累计出货量超过10万片、征程芯片累计出货量超过300万片。
其中,地平线与理想汽车从去年的三四月份开始合作到年底量产上市搭载征程5的车型,大概只花了七到八个月时间,实现了业内高速NOA的极致量产交付速度。今年地平线也与比亚迪达成征程5量产合作。最近的上海车展也发布了跟国际Tier1采埃孚的全面战略深度合作。无论是Tier1还是OEM,地平线都能够用最快的速度、最好的质量、最先进的算法,为其带来最新的产品。
从0到1突破,从1到N开放共赢,地平线已经达成陪伴所有用户安全行驶超过百亿公里程。期待今后在高级别自动驾驶发展的商业化过程中,地平线为行业奉献更多的力量。