2004年3月13日,在美国莫哈韦沙漠地区举行了第一届自动驾驶汽车比赛——darpa大挑战赛(darpa grand challenge)。这是世界上第一个自动驾驶汽车长距离比赛,15支参加决赛的团队在142英里(约228.5公里)的赛道中展开角逐。
最终,这场比赛没有完赛者,甚至连接近完成的都也没有。走得最远的是卡内基梅隆大学的红之队(red team),他们用悍马沙暴(humvee sandstorm)行驶了7.4英里(约11.9公里),还不到全程的5%。
但就是这5%的路程,其象征意义非常显著,可以说一个新的行业由此而生。
参加过第一届比赛的axion团队软件负责人梅兰妮·杜马斯·格林(melanie dumas grimm)说:“这是从学术论文到走向实际应用的第一步的转折点,将被载入史册。”
她自己也在这次比赛之后,成为了waymo技术项目经理,帮助该公司在凤凰城、旧金山和洛杉矶等大都市部署robotaxi。
曾担任谷歌街景和自动驾驶汽车项目的高管,又在2018年担任了自动驾驶矿用卡车初创公司pronto首席执行官和联合创始人的安东尼·莱万多夫斯基(anthony levandowski)也是首届darpa大挑战赛的参赛者,那年他只有23岁。
他回忆说:“就像生活中的大多数事情一样,第一次尝试就做对的问题很难。没有人赢得比赛,让每个人都有信心可以再来一次,这让人们更加磨炼了坚持不懈与不断磨炼的品质。”
驭势科技ceo吴甘沙曾见证了2005年第二届darpa大挑战赛,彼时他任职的英特尔公司直接赞助了卡耐基梅隆“红之队”,随后又派了一支团队加入到斯坦福斯坦利车的课题组。
这次挑战赛的过程是“红之队”一路领先,但到中后程被斯坦利超越。英特尔参与的两个车队最终夺得了前两名。
那是吴甘沙第一次接触自动驾驶,他回忆说:“感觉当汽车变成无人驾驶时,每一块平面、每一个空间、每一个功能都值得重新设计。”
而“红之队”的失败让他有了敬畏之心,认识到再牛的团队、再高大上的自动驾驶,也受制于木桶原理,即使一个普通得不能再普通的零部件失效,也会让自动驾驶一文不值。
darpa大挑战赛就像一个大树,后来无数自动驾驶人才都是在这里开枝散叶出来,又落到各个公司,谷歌、优步、通用、福特等等,成为了培育一批又一批自动驾驶骨干的摇篮。
困境与瓶颈
在2009年google x实验室启动自动驾驶项目后,硅谷涌现了一批自动驾驶初创企业,也吸引大批风险投资和高科技人才汇聚于此。此后的十来年里,自动驾驶在巨量资金和大批顶尖人才的支持下,获得了长足的发展。
随着全球疫情肆虐,经济下行,自动驾驶行业也遭受颇多挫折:技术进展变缓、商业化落地艰难、投资人信心匮乏,这导致大批海外明星创业企业倒闭、上市公司合并、融资难以为继。
今天,硅谷自动驾驶初创公司的高管们依然坚信,这项新兴技术可以重新诠释传统的驾驶和移动方式。相比于美国每年近4.3万人死于道路交通事故的现状,自动驾驶系统将大幅提高安全性。
然而,麦肯锡公司(mckinsey & co.)估计,尽管自动驾驶技术已经投入了2040亿美元,但如今的美国道路死亡人数几乎与以前相同,而自动驾驶车辆广泛普及、能够行驶到任何公共道路可以到达的地方的承诺仍然难以实现。
对于近期自动驾驶遭到的冷遇,吴甘沙认为,科技的热点是一直在变化的。能长期活得好的公司,不在于它抓住了一个热点,而是它能抓住一连串的热点。
任何一个长赛道的方向,一定不会一直在热点上,而有很长的时间是在水下,参与者必须得不停地扑腾,去调整呼吸,才能活下去。其实自动驾驶已经维持了五六年的热点,现在肯定是在波谷,等到下一波波峰来了,它又会热起来,没准到那个时候可能大模型不热了,又会有新的技术站出来。
对于融资困难,他认为,如果说一个初创企业估值不是高得离谱,同时业务又在快速发展,利润现金流在不断改善,在所处领域又具备垄断性的领先优势,这些企业融到钱应该不是问题。
轻舟智航ceo于骞则认为,现阶段的核心问题还是在技术本身的突破,包括自动驾驶冰山以下的感知、规控等算法模型、数据闭环技术本身和研发范式的突破仍然是关键。数据怎么样能很好地流转起来,怎么样更好地管理,把它做筛选、标注、训练以及大规模仿真的验证,实现高效的数据闭环,对于自动驾驶大范围普及是非常关键的。
从成本角度看,实现高阶自动驾驶所需车载传感器的数量显著增加,这些硬件最终都会体现在成本上。除了技术层面的瓶颈,法规和市场接受度也是自动驾驶商业化需要面对的挑战。
因此,自动驾驶商业化需要政府、企业、科研机构等多方共同努力,从政策、技术、市场等多个角度入手,推动自动驾驶技术的研发和应用。
马拉松和拳击赛
波士顿咨询集团(boston consulting group)移动创新中心(center for mobility innovation)联合负责人奥古斯丁·魏格谢德(augustin wegscheider)仍然看好自动驾驶的未来,但他不再将发展与时间表挂钩。
他说:“更明智的选择是,我们只把它称为‘未来’。”“描述大规模的场景,比准确说出它何时会发生要容易得多。”
其实,早在第一次darpa大挑战赛活动举行时,就有人看出自动驾驶乘用车将面临着艰难的发展过程。
“红之队”的领导者卡内基梅隆大学机器人专家威廉·惠特克(william whittaker)教授说,第一次大赛中车辆缺乏一致性,让比赛感觉像是“星际迷航中的酒吧场景”。
曾有业界人士把自动驾驶比作攀登珠峰,一条路线是从尼泊尔出发的南坡,相对稍微平缓;另一条路线是从西藏出发的北坡,更为陡峭、崎岖。
对应着自动驾驶行业的两条大的研发路径:一条是以车企为主的渐进式策略,一般从l2开始,再逐步叠加高阶功能;另一条是以科技互联网企业为代表的跨越式策略,直接从l4、l5开始研发。而它们最终的目标都是登顶自动驾驶的顶峰——无人驾驶。
以waymo为代表的“北坡”路线,即使waymo有非常多的资源,很强大的技术实力,也难以突破北坡。相反,以特斯拉为代表的“南坡”渐进式路线从l2入手,通过输出阶段性的智驾产品为下一代产品积累数据,迭代性的获得盈利的同时,逐步上攻。这似乎让所有人都看到了一条最终通往自动驾驶的可行路径。
而渐进路线要满足两个要求,首先能商业化,有造血能力,养活自己,而不是长期靠风投来买单,其次是能不断成长、到达终局。
吴甘沙将当下的自动驾驶发展总结为四点:
首先,他相信自动驾驶是一个解决了亿万人痛点,同时又具备万亿级规模的市场,所以毫无疑问还是一个非常理想的创业方向。
其次,现在自动驾驶行业目前是处在低谷当中,亟待技术突破和商业闭环的形成。
第三,自动驾驶的难是来源于它的本质,也就是99分等于0分,最后那一分可能是需要99%的时间和精力,所以自动驾驶一定是持久战,而正因为是持久战,创业公司才有生存机会。
第四,创业公司的发展一定要选用渐进式的技术路线和沿途下蛋的商业路线。
“自动驾驶是一个长赛道,参与者既要学会马拉松,也要学会打拳击赛。马拉松能够让你一直跑下去,拳击赛能够让你在终局时能有核心竞争力。”吴甘沙说。
因此,从创业公司的角度来说,得把战略想清楚,找到合适的切入点,寻找那些既在巨头的射程之外,又真正能为客户解决高频刚需问题的市场,只有这样,才能够有足够的利润支撑企业坚持下去。
佑驾创新公司ceo刘国清博士认为,如果自动驾驶的商业化进程和技术等级对应,渐进式地“沿途下蛋”,瓶颈不会很显著。如今消费者越来越重视车辆中的智驾功能,恰恰证明了其商业化前景之广阔。
他说:“l4、l5自动驾驶大规模商业化还须一段时间,我们看到国外的一批自动驾驶公司,热度也不同程度的冷却下来。这其中技术的成熟度只是一方面,我认为更关键的在于挖掘需求。如果没有需求、或者是伪需求,就无法建立可持续的商业模式。”
大模型是新希望吗
在吴甘沙看来,大模型技术对于未来自动驾驶走到终局,肯定是一个很重要的方向。
首先,大模型加深了对环境的理解。因为今天的自动驾驶其实本质上还只做到了在场景里面确保不撞,但是缺乏对于场景的深刻理解能力,缺乏对于与其他的交通参与者的人性化互动。
第二,现在自动驾驶之所以这么累,因为它不收敛,永远有没见过的问题暴露出来。本质上就是人工智能没有出现涌现式的跃迁。这是因为今天车端能跑的算法,参数规模可能只有几千万或者是上亿,而参数规模的局限,导致了它不可能具备涌现的能力,所以永远不会收敛。如果车端处理的参数规模能达到10亿级别,它的模型就会具备涌现跃迁的能力,也就能更快地接近终局了。
他认为,大模型其实已经在一些方面起作用了:从短期来看,如果数据少,缺乏corner case,大模型可以帮你生成;如果数据多,人来不及标注时,它能够帮你标注;它还能通过知识的蒸馏,把大模型里面的知识变成一个车端能跑的小模型等。从中长期看,一是它将具备世界模型能力,对世界有更好的理解;二是它会实现涌现跃迁,解决一直不收敛的问题。
于骞也表示,首先,现在技术发展方向正在朝向数据定义阶段发展,算法模型需要具备强大的数据学习和场景泛化能力,有效解决各类corner case。所以,未来几年,智能驾驶更大的价值来自于数据。轻舟的研发范式也在从以模型为中心转向以数据为中心。
最近端到端在国内掀起新一轮技术革新风暴,成为智能驾驶技术竞争的全新制高点。一旦进入这个阶段,输入信号完全是原始的传感器的信息,输出就是转向、刹车、油门这样的控制命令,数据的重要性越来越大。尤其是agi(artificial general intelligence,通用人工智能 )时代出现后,在数据规模方面,模型相比数据规模来讲的重要性变得越来越小。
其次,生成式ai技术展现出了巨大的潜力。自动驾驶需要大量数据支持算法模型的训练,以适应各种驾驶场景和复杂路况。然而,传统的数据采集方法可能受限于实际道路条件和安全问题,无法获取到大量多样化的数据。生成式ai能够生成肉眼无法分辨真假的图像,为模型训练提供高质量合成数据,从而破解自动驾驶数据和测试难题。
从事ai研究20余年的瑞因凡(上海)智能科技有限公司联合创始人、ceo韩东告诉汽车商业评论,大模型或者说生成式ai,对于自动驾驶肯定是有很大的推进作用,也是目前能看到的未来真正到达l5的唯一可能性。
但这不代表现在离这个目标很近,因为完全自动驾驶l5趋近于agi。他认为,最终完全的自动驾驶不意味100%的安全,因为任何交通工具出行都有出事的概率。只要概率低到让你觉得这是一个不可能碰上的小概率,其实大家就已经无所谓了。
他觉得,现在类似gpt-4这种通用大模型,还在不断迭代当中。假设算力不是瓶颈,做推理的速度足够快,车端侧变得可用,遇到任何路况,系统立刻就可以做出很正确的反应,还足够便宜,那就可以实现自动驾驶了。但现在实现不了,主要因为使用大模型进行推理太贵。
比如说马斯克的xai公司最近刚刚开源的大模型grok-1,拥有3140亿参数,是迄今为止参数量最大的开源大语言模型。如果你要把它跑起来,可能就要四五张英伟达a100 gpu,而一张a100售价就接近10万元人民币,很显然这在车端不现实的。所以未来怎么样让车侧的模型变得更小,更容易去做推理,更便宜更快,才是实现完全的自动驾驶的过程。
至于车端大模型需要多大的参数规模,他现在不太敢判断,因为大家对于这种多模态模型的参数规模,并没有一个特别清晰的认知。l5什么时间到达也比较难说,如果技术足够成熟,安全性足够高,他觉得应该是10年到20年之内的事情。
刘国清猜测,自动驾驶突破的关隘,不在是不是有另一项新技术,而是在基础设施和能源上。比如ai大模型的背后是巨大的算力,支持算力的是大量消耗的电力。“自动驾驶目前的车载算力也越来越大,可以预见的是,越往l5走、或者从车端到路端、从车端到云端……我们需要的算力也越来越大,因此需要巨量的计算技术设施和能源的支持。”他说。
曙光在哪儿初现
从行业的发展来看,汽车并不是darpa大挑战赛催生的唯一业务。按自动驾驶的发展来看,该赛事的血统跨越航空航天、采矿、农业、卡车运输、拖拉和其他领域,总价值达数百亿美元。
农业成为惠特克教授预见到的明确用例。现年75岁的惠特克在家乡宾夕法尼亚州霍利迪斯堡附近的一个农场里,一边开发农业机器人,一边研究太空探索机器人,仍然激情澎湃。
根据市场研究公司grand view research的数据,去年农业机器人市场估计为115亿美元,预计到2030年将以20.6%的年增长率增长。农业巨头约翰·迪尔(john deere)提供一套自动化拖拉机选项,并把全自动拖拉机宣传为“额外工人”,“从不迟到”,也不介意“通宵工作”。
采矿也是自动化驾驶系统的第一波实际应用。去年8月,沃尔沃自动驾驶凯发k8一触即发的解决方案取得了里程碑式的进展,从挪威velfjord的bronnoy kalk矿山拖运石灰石的7辆卡车上撤下了人类安全驾驶员。grand view research估计,到2023年,全球采矿自动化市场的价值超过50亿美元。
据吴甘沙介绍,驭势科技在机场和工厂的无人驾驶已经实现了商业化的应用。目前香港机场已累计投入50余台驭势科技无人驾驶车辆,已实现超过1000天的完全无人驾驶常态化运营,为机场提供全天候的无人物流和接驳服务。他认为,像在机场的自动驾驶应用,现在还是温和增长,但快的话2026年,慢的话可能2027年、2028年就要进入爆发的转折点了。
他认为,自动驾驶的发展,要取决于几件事:第一是技术靠谱,从技术上保障安全可靠的运营,不能按照平均值来去做技术,而是要考虑到最复杂的场景;第二,需求必须是高频刚需,提升利用率,可以替代人类司机;第三是账要算得过来,也就是让客户省钱,让自动驾驶企业赚钱。
于骞表示,2024年被认为是智能驾驶大年,是从电动化向智能化发展的关键时期。在大规模前装量产领域,沿着“南坡”路线的渐进式模式,l2 级高阶辅助驾驶会从高速noa到城市noa逐步普及。城市noa是辅助驾驶的天花板也是无人驾驶的入门槛。
另一条沿着“北坡”路线的l4自动驾驶领域,自动驾驶的规模化应用遵循从简单场景到复杂场景,从低速场景到高速场景,从载货到载人的原则。可能会最先在园区接驳、安防巡逻、物流配送、环卫作业、公交、港口码头、智能矿山、无人零售等领域开展应用普及,目前已经在逐步走向商业化试点运营。
其中,自动驾驶公交不仅限于交通出行,而且可以成为连接乘客、交通与服务的智能体。自动驾驶小巴是中低速场景,乘客对车速的预期可控;走固定路线,更能确保行驶安全;多人出行,具有社会效益,有望成为公开道路上的l4自动驾驶最快实际落地场景。
在刘国清看来,如果从gartner曲线的阶段来看,自动驾驶目前已经处于爬坡期,正在往成熟期进发。技术层面,bev transformer将自动驾驶技术提升到新的高度,实现感知与决策一体化。市场层面,消费者认知和需求也在爆发。l3及以下的技术目前已经规模化应用在车辆上,l2功能更是几乎成为新造车势力的标配。而robo-taxi等l4业务也在多个城市落地开花。
从趋势看,汽车消费市场里低阶自动驾驶已经开始普及了。在生活场景下,它能改变人们的驾乘体验;而在生产场景下,自动驾驶如果能成为生产工具,或者促进生产效率,也是会率先普及的。比如在限定区域内的客运接驳、干线物流、最后一公里配送等等。