小鹏智驾李力耘:我们处于无人化前夜智驾Scaling Law还有很大红利|36氪专访
2024-12-26
[摘要]   李力耘:其实就是第一性原理。我们生活的交通环境,包括路牌、路标、红绿灯,整个道路甚至车的造型都是为人来设计的,人最重要的传感器是眼睛,所以纯视觉一定

  李力耘★:其实就是第一性原理。我们生活的交通环境,包括路牌、路标、红绿灯,整个道路甚至车的造型都是为人来设计的,人最重要的传感器是眼睛,所以纯视觉一定是最直接★★★、最高效的解决方案。特斯拉也分享过观点,认为激光雷达+纯视觉1+1并不大于或等于2★★,而是小于2。

  李力耘★★★:端到端模型的建立是个非常缓慢的过程。系统工作方式从原来多技术模块变成AI中台★★。我们会着重建设数据采集能力、数据清洗,模型快速训练、部署、调试★★★,确保模型高效解决问题★。

  “我更愿意相信是车企,而不是供应商,能够率先从辅助驾驶突破到无人驾驶。”

  李力耘★:我不反对。这些观点在以不同的视角来描述端到端★★,在我看来可能殊途同归。无论是视觉语言大模型,还是视觉动作大模型,本质是通过大量数据输入,有一定推理能力,很好地实现类人驾驶的模型。

  另一方面,得益于小鹏AI的进展,我们需要大量★、高效敏捷地去挖掘数据,训练模型★★。所以我们既做车端模型、云端模型,也做了非常好的AI工具来挖掘数据★★。

  李力耘:我们一定会推进 L3 和 L4。哪个更快,这个取决于法规进展,我们一定紧跟着法规进展★。在明年的Q1★★★、Q2某个时候,随着我们体验和能力更进一步的提升★★,大家会看到更多可能★★★。

  36氪汽车:行业会有些做法,比如将端到端大模型跟视觉语言模型融合★★,您认同这种观点吗?

  用端到端大模型赋能“车位到车位”后,用户体验会大大提升★,虽然有时候可能需要学习、参考先验信息,但学习感会很弱。

  李力耘★★:我们会全系标配Max★,也就是小鹏 AI 图灵智驾(NGP),都会用纯视觉方案★★。

  第二★★,主机厂在软硬件方面的配合、数据和中后台的配合,可能是事半功倍★★;对非主机厂而言,可能更不容易★★★,数据背后的闭环是更隐形的挑战。

  “中美路况非常不一样,我们更懂中国路况,更懂国人的驾驶习惯,特斯拉可能更懂美国人的驾驶习惯,很难说谁更强。”李力耘说。

  实际上,凭借在同级车型中做出★★“智能差异化”的赛马策略★★★,小鹏已经在两款新车 MONA M03和P7+上,尝到了甜头。

  李力耘:不久前,我们把XOS 5★★★.5.0 过程版也推给了他★★★,他觉得我们又解决了30%-40%的问题。

  因为,端到端不是让事情变得更简单★,而是让整个迭代链条变得更长,更加不可控,某种程度上需要投入更多的资源,包括更大算力★,更加精英的AI研究人员★★★。

  角逐和较量在智驾圈里已经不新鲜。过去一年里★★★,小鹏等车企迅速卷入了“全国都能开★”“端到端★★★”的智能驾驶竞争。

  36氪汽车:今年智驾行业变化很大,年初卷★★★“全国都能开”,后来变成端到端★★,现在是“车位到车位”★,您怎么看这种竞争?明年的竞争重点是什么?

  规则还是很重要的兜底能力★★,一方面是为安全兜底★★,第二,原来规则积累的工程基础,可以让我们把整个数据闭环、飞轮非常高效地建立起来★★。

  去魅的话,我觉得中美路况非常不一样★,无论是我们XNGP 5.4★★★.0还是即将发布的5.5.0 版本★★,智驾都和特斯拉不相伯仲。我们更懂中国路况★,更懂国人的驾驶习惯,特斯拉可能更懂美国人的驾驶习惯,很难说谁更强★★★,我非常期待FSD进入中国之后的表现。

  近日,小鹏智驾负责人李力耘接受了36氪的采访★★,他分享了小鹏如何将AI融入智驾,以及标配纯视觉智驾后,如何实现科技平权与商业闭环★。

  36氪汽车:友商通过端到端快速实现了高阶智驾量产。端到端会是行业其他人弯道超车的方案吗★★★?

  智能驾驶走向自动驾驶的过程不是一蹴而就,而是车企们通过技术攻坚,不断完成高速★、城区、泊车、园区等场景拼图。如今,这一步即将完成。

  小鹏推出“端到端”大模型智驾方案的标志性成果,就是更果断摆脱对激光雷达的依赖★,将纯视觉作为智驾技术路线+上,小鹏就标配了纯视觉智驾AI鹰眼方案。

  36氪汽车:行业会说特斯拉技术领先国内半年到一年,您觉得这种技术领先现在还有多少★?

  所以★★★,我们用“一段式端到端”实现所有车型标配后★★,现在去实现全场景覆盖,包括“车位到车位”低速行驶、园区行驶,未来还会覆盖泊车★、高速,甚至海外智驾。我们希望给用户带来更加连贯★、丝滑的体验,而不是有割裂感★★、类似于VPA+NOA的组合体验。

  李力耘:当时主要在开城,状态很难,因为把高精地图的拐杖扔掉之后,尝试用实时算法去认全国各种各样的路况★★,并且让车能够配合好行驶★,是非常困难的★★★。唯一能够彻底解决这件事就是靠AI,用类人的方法把路认好★★★、把路选好,让车开好。

  李力耘:第一次肯定没有地图,很难,如果有园区内导航指引会好一些。就像你第一次去一个地库,也需要一些指引或者借助他人的记忆,我们可以做到无感学习和记忆。第二次去就可以有丝滑的“车位到车位★★★”能力★★。

  特别声明★★:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号★★”用户上传并发布,本平台仅提供信息存储服务。

  李力耘★★:在MONA M03,智驾也起到了很重要的作用。同样价位上,小鹏MONA M03 的智驾仍然领先,比如MONA M03率先推出断头路泊车★★,体验上和主销车型Max版泊车能力一样。春节之后,MONA M03的 Max版本也会上AI鹰眼视觉方案★★,实现高阶智驾的普惠跟平权★★。

  李力耘★★★:小鹏智驾真正的一号位和灵魂就是何小鹏。因为他笃定AI,笃定智能驾驶到自动驾驶,才有小鹏智驾的自我变革。他非常从用户视角来看智驾★,会去开智驾的中间过程版本和量产版本,感受变化,反馈问题。

  李力耘:我们大约在2022年底,就开始预研如何引入AI大模型★★★,已经有了几年的积累。而且我们地把规则时代积累的经验移植到当前的数据采集和训练里★,例如通过车端规则经验实时标注,精准采集训练所需片段★,从而针对目标场景进行精准密集训练,能够大幅地提升采集和训练效率。

  李力耘:小鹏是Scaling Law的忠实信徒★。虽然最近很多AI前沿工作说Scaling Law、预训练遇到了瓶颈。但从算力、数据量来看★★★,我觉得自动驾驶的Scaling Law还有很大红利。

  李力耘★★★:我们即将推给用户的XOS 5★★.5.0版本上,用“一段式端到端”给用户提供了一个完整的“车位到车位★★★”体验。其实在停车场和地库,2021 年我们就推出了VPA(记忆泊车)功能,但用户体验并不好★★,用户渗透率没有城区智驾那么高。

  这背后蕴含着一套清晰的智驾商业化策略,“我们会用一段式端到端放大我们的车型优势★,不仅标配所有车型,更希望覆盖所有功能,实现点到点★,包括赋能海外的智驾。”纯视觉智驾方案,无疑在成本上拥有先天优势。

  李力耘★★:我恰恰觉得,这些情况下,第一性原理是更好的★。再好的激光雷达在远处的点云也是比较稀疏的。激光雷达不是完美的,在一些雨水天气情况下它也有问题。小鹏AI 鹰眼视觉是通过更大算力,看得更清楚、更远、反应更快★,车辆反应速度提升了百分之四十几,对场景做出很好的响应。

  李力耘:从技术方法论上,小鹏和特斯拉★★★、OpenAI 这样的全球AI企业不谋而合,我们强调云端大模型,参数量是车端80倍以上。我们云端大模型的训练数据量达到2000 万以上clips。每个clips可以理解成大约一分钟的小电影。每个模型都基于大量数据、在云端训练。我们有个说法叫★“云上一天★★,地上三五年★★★”。

  在纯视觉智驾之路上,小鹏汽车决定走到底★★★,李力耘告诉36氪★★,从P7+车型开始★★,不再有Max和Pro的版本区分,而是★★“全系标配Max★★★,也就是小鹏 AI 图灵智驾(NGP)★★,都会用纯视觉方案★。★”

  李力耘告诉36氪★,小鹏对于端到端的研发始于2023年4月★,当时主要是想用AI的认路能力★★,摆脱对高精地图的依赖。

  小鹏的确是国内最早贴上★“智驾”标签的车企之一★★。2019年★★★,小鹏就在轿跑车型P7上开发了高速NGP功能★,对标特斯拉NOA★★。

  李力耘说,如果把端到端的技术趋势看作智能驾驶驾领域的一场“工业革命★★★”★,能真正实现转型升级的企业其实是少数,大部分人还是会面临更残酷的竞争★★。

  李力耘:第一★★★,智驾真正从辅助驾驶走到无人驾驶一定是满足第一性原理的★★★。我更愿意相信是主机厂,而不是供应商,能够率先从辅助驾驶突破到无人驾驶。

  李力耘:小鹏自研芯片的初衷就是实现软硬件一体★,最大效能地发挥软件的威力。但更重要的是在云端模型的赋能下★★,我们会对芯片做针对性优化★★★,给用户提供最好的体验。

  很多驾驶是相对本能的动作,就像人类的小脑,当然也需要大脑的能力★★★。所以在我们的一段式端到端大模型中★,Xbrian可以认路识字,做一些简单推理,但更多时候还是对加减速控制、变道时机选择,或者绕行处理,更偏本能的小脑行为。

  36氪汽车:小鹏自研的智驾芯片,结合你们的软件方案后★,可以发挥出什么样的效果★?

  李力耘★★:我们一直跟大众配合很好★★★,无论是在车型上★,还是电子电气架构上,或者智驾上,双方都是紧密合作。智驾会有专门的虚拟团队和项目组去跟进★★,和大众合作的车型会很快和大家见面★★。

  端到端智驾依赖的核心资源之一就是数据,小鹏宣称,其端到端大模型训练数据量已经达到2000万clips★。理想汽车也公开过其端到端的训练数据,目前大约在800万clips。

  我们是既希望有聪明的大脑,能够推理思考★★,还是一个比较灵敏的、肌肉记忆很好的老司机★★★。

  从美国试驾完特斯拉FSD回来,小鹏智能驾驶负责人李力耘有两大感受。其一是,特斯拉FSD在北美地区的确是独一档,但他也意识到★★★,需要对特斯拉祛魅★★。

  小鹏的AI鹰眼视觉做到了比人的视觉更好的效果★。在很多大光差★★、逆光的情况下会比人眼有更好的识别效果,这也是我们LOFIC架构的特点。当然我们也没有放弃主动的传感器,也会通过多模态跟毫米波雷达,超声波雷达去做融合★★★。

  结果小鹏发现,★“一段式端到端★”大模型上线之后,原来需要花很长时间打磨的场景,如特殊分流、右转或掉头等问题★★★,很快就被解决了★★。

  李力耘:得益于两方面,一方面是AI智驾铁军,车端积累多年的规则和严谨算法★★,很多事情在车端做是事半功倍的★★★。

  36氪汽车:除小鹏本身之外,智驾团队还要支持别的项目吗,比如参与大众的项目?

  所以对行业态势的感知一定是多模态的。现在我们特别注重用户反馈的NPS,智驾每个版本都会去做用户调研。当然也会和顶尖AI企业保持紧密接触,包括去美国开车★★★、取经等,兼听则明。

  我们希望,明年在能力上有所突破,可能先在Max车型上,小鹏智驾逐步提供类似无人驾驶的能力★★★,接管次数无限降低。随着法规推进★★,或者新车型推出,我们一定会做出走向无人化的能力。小鹏的最终目标是解放驾驶员的双手★★★、解放精力★。

  宝宝因为关灯把自己吓哭,宝宝:求求了千万不要变黑★★,网友:看把孩子吓得原谅我不厚道的笑了

  李力耘:如果把端到端技术趋势看作智驾领域的一场“工业革命”★★★,每一次工业革命中,真正实现转型升级是少数,大部分人还是面临更残酷的竞争★★★。

  李力耘:小鹏是非常笃定地把辅助驾驶推向极致,走向无人驾驶的★★。在AI辅助驾驶的理念下,我们会更看重像AI鹰眼视觉带来的智能驾驶体验平权★★。至于真正的商业化★★,可以关注小鹏在2026年无人驾驶的进展★★★。

  李力耘:2023年4月份,我们开始布局整个“端到端”技术栈。那时候我们希望用端到端来解决对高精地图的依赖问题,做到全国都能开,所以当时智驾AI化★★,更注重识路、找路。2023年底,我们意识到需要把端到端的能力进一步扩大★★,做成一段式端到端。

  小鹏以视觉为主,我们实现了★★“光子进★★、控制出”。当然★★★,从多模态输入角度来看,视觉只是一个传感器,本身还有各种车道★★、GPS或者是各种各样多模态输入。

  36氪汽车★★:市场上会有观点说,小鹏现在车卖得好不是靠智驾,比如MONA M03。您会反驳这种观点吗?

  网上的海量数据会让模型有更强的认知能力,识字认路★。但是我们认为,拥有高质量的、丰富驾驶数据可以更好解决车辆驾驶的小脑问题,这跟大模型不冲突。

  李力耘:现在智驾就像当年的手机行业,我们一定要把智驾价格打下来★★,未来的车型都会标配高阶智驾。其实,智驾是小鹏P7+用户购车的 top 理由★。我们不会用智驾能力再做二次收费。

  李力耘★★:2025年小鹏智驾转折点会在年中★★★,智驾能力会有更大飞跃★★★,可能会从一段式端到端,跨越到全新的 AI 迭代模式。

  在今年12月末,小鹏还计划交付★“车位到车位”智驾驾驶功能,技术模型也升级为“一段式端到端”,可实现全场景覆盖,包括园区低速行驶★★★,未来会覆盖泊车★★、高速场景,甚至海外智驾。

  端到端不是让事情变得更简单了★,组织架构的确跟原来不一样,原来每个技术模块都要基于规则的工程师,比如定感知、定位★★★、规划、融合★★★、地图★★、控制,现在就变成了数据闭环的问题。

  智能驾驶技术在车企的商业体系里已经越嵌越深,同时,也在承接整个AI技术的发展红利★★★,快速迭代。这是资源和效率交织的产物★★。

  李力耘也表示★★,现在小鹏处于★“无人化(驾驶)前夜”,明年在能力上会有更大突破,“可能先在Max车型上,小鹏智驾逐步提供类似无人驾驶的能力★★★。”

  但在行业中★★★,未来数年的主流选择还是以视觉+激光雷达作为主要传感器★★。对此★★★,李力耘向36氪汽车表示★★,走纯视觉路线其实是出于第一性原理★。

  12月初,特斯拉向部分测试用户推送的特斯拉FSD v13.2更新版本,就包含了从停车状态启动的FSD,也就是★“车位到车位★★★”功能。前不久理想汽车也宣布突出该功能,华为和小米汽车的类似功能,同样即将推出★。

  在他看来★,人们生活的交通环境,包括路牌★★、路标、红绿灯,整个道路甚至车的造型都是为人设计的,“人最重要的传感器是眼睛★,所以纯视觉一定是最直接、最高效的解决方案★。★”

  数据采集★★★、模型训练、模型部署★★★,模型调试,它让整个迭代链条变得更长,更加不可控,某种程度上需要投入更多的资源★★★,包括更大算力★★,更加精英的AI的研究人员。

  “车位到车位”是当下车企智能驾驶竞争的技术高地。如字面含义,车企希望用户在车位就能启动智驾★,车辆低速巡航、自主过闸机、上高速★★,在城市道路通行,最后泊入目的车位★★。

  我们希望把云端能力通过蒸馏下放到不同芯片平台★★★,甚至未来换芯片后也能把云端模型下放★★★。

  “智驾是小鹏P7+用户购车的 top 理由。”李力耘说★,当下热销款M03的泊车体验也与Max版智驾同级★★★。

  效果未达预期,伊朗解除WhatsApp及Google Play访问限制

  另外,无论车端还是云端算力,都会有着更显著的增长★★★,模型参数也会进一步扩大。我觉得自动驾驶的Scaling Law还没有到尽头。

  同一时期★,行业有玩家迅速进入了高阶智驾量产状态。比如压强式投入的华为,率先推出了“全国都能开”智驾功能;理想汽车则由于轻包袱,果断切入★“端到端”技术,甚至直接更换到激进的“一段式端到端★”方案★★★。

  《编码物候》展览开幕 北京时代美术馆以科学艺术解读数字与生物交织的宇宙节律

  但因为起步早,小鹏几乎走过所有技术路线★,从依赖高精地图,转向无图方案,随后进化到端到端。2023年8月★★★,小鹏智驾还经历了灵魂人物吴新宙离职、团队动荡等★★。小鹏智驾由此进入守城阶段。

  李力耘★:但很遗憾,因为v13还没有量产推给用户,我没机会试FSD v13,但开了一个星期v12.5。有两点可以总结,第一是祛魅,第二特斯拉在北美是独一档的存在,很多值得学习的地方,包括停车场激活、开进停车场,这些是用户非常喜欢的功能。

  M03自9月上市以来连续3个月销量破万★,P7+上市3小时也获得了超3万大定。这两款车的售价都在20万元以下★★★,这个价格带是比亚迪等老牌车企的优势领域。

  36氪汽车:你们会对 L3 有更多探索吗★?还是会直接进入到L4★?哪个更快?

  这背后是组织方式的改变,我们有个AI效能部门,今年年中面向AI成立的新部门★,专门训练各种各样的AI提效工具,包括用AI写代码★★、检查代码、自动挖掘数据。

  36氪汽车★★:您觉得特斯拉FSD v13上的“车位到车位”跟国内的“车位到车位★”有区别吗?

  【美股盘前】三大期指齐跌★★★;金山云涨超10%;特斯拉推出新一轮FSD免费试用计划★★;投行Cantor Fitzgerald将博通目标价上调至300美元

  36氪汽车:智驾行业密集迭代,公司创始人何小鹏怎么保持对智驾前沿的认知★★?

  原来的方案是小模块AI驱动★★★,然后做路径规划★★★、速度规划,整个链条非常长,遇到的问题很多。但我们用了AI能力后,环岛掉头★★、小路★、很难的右转场景都有很大的能力提升,效率比原来高很多。

  他同时认为,在海量数据、不断提升的云端和车端算力下,自动驾驶的Scaling Law还有很大红利★。

  今年从★“全国能开★★★”逐步走向端到端,比拼的是博弈能力、比拼拟人化。到“车位到车位★”之后,我觉得我们处在“无人化的前夜”阶段,小鹏智驾会笃定地走向无人驾驶。

  李力耘:原来小鹏智驾是孤勇者,现在是百舸争流,明年的竞争一定会更加激烈和有趣。

  更重要的是,我们会用一段式端到端放大我们的车型优势,不仅标配所有车型,更希望覆盖所有功能★★,实现点到点★★,包括赋能海外的智驾★。

  36氪汽车★:智驾供应商跟传统车企如果保持比较深度的绑定,能继续参与这场游戏吗★?

  热搜!董明珠回应格力电器卖得贵★★★:格力做的不是眼前一点利益★★★!对于年轻人★★“躺平★★”等现象★,她认为★.★..★★★.★..

  36氪汽车★:端到端方案依赖海量数据,小鹏达成了2000万clips的训练数据,在这方面小鹏有没有什么心得★★★?

  对于2000万clips的数据起点★★★,李力耘告诉36氪,这得益于过去基于规则的智驾经验积累,小鹏当前的数据采集和训练效率很高★★★,例如通过车端规则经验实时标注★★,精准采集训练所需片段★★★,从而针对目标场景进行精准密集训练。

  在小鹏X9 上,73%的车主都选择了Max车型。我们也会持续关注用户对智驾的反馈★★★,比如他们喜欢的一些亮点或者不喜欢的槽点;在标配智驾后★★★,我们会看用户的渗透率,比如在能开智驾的地方,用户是不是都开★★。

  36氪汽车:小鹏之前也有记忆行车★,比如记忆10条路线★★★,这跟★“车位到车位”的本质区别是什么?

  36氪汽车:在高速道路上或者一些特殊天气,激光雷达还是有很好感知效果,小鹏纯视觉有没有解决这种特殊天气场景下的方案?

  李力耘:重大转折是今年四五月,小鹏一段式端到端大模型上线之后,我们发现,原来需要花很长时间打磨的一些问题,比如花几个月去打磨一些特殊的分流★★、右转或者是掉头等场景,解决得特别快,我们很惊讶★★★。

  36氪汽车:小鹏智驾成为标配,要从哪些角度去评估智驾技术的商业价值★★?会有指标吗★★?

  小鹏也宣称,其基于AI鹰眼的纯视觉方案,能做到比人眼视觉更好的效果,可以很好应对大光差★★★、逆光场景★★★。

  今年5月,小鹏正式推出“端到端”智驾大模型★★,包含神经网络XNet★★★、规控大模型XPlanner★、大语言模型XBrain三大部分。

  李力耘:最大区别还是体验层面。小鹏智驾在2024年最大的两个变化,第一是 AI化,面向AI进行组织变革,进行AI能力提升,另一个变化是,我们觉得用户不会为更好的科技买单★★★,但一定会为更好的体验买单。

  36氪汽车:小鹏智驾起步非常早★,经历了很多个版本★,在端到端进化这条路上你们甩掉了哪些包袱★★?

  数据方面★★★,互联网优质数据大概600-700T之后就会有瓶颈。但智驾大部分企业今年才逐步转向端到端★★★,自动驾驶大量优质驾驶数据积累还没有到尽头★★★。

  Scaling Law是大模型行业的一个定律,通常表示模型参数越大、数据集越大和计算资源增多,模型性能更好。

  36氪汽车:后续像在 X9 这些车型上★★★,还是会保留激光雷达和纯视觉两种不同的方案吗?

  36氪汽车:华为没有把纯视觉当成主流方案★★★,小鹏为什么会这么坚决地要做纯视觉?

  李力耘:我们希望2025年★,在拟人感、安全感、舒适和效率上,做到更不一样的台阶和层次,与行业明显拉开代际差距★。

  36氪汽车★★★:从2023年到现在,如果要选取比较重大的转折点,您觉得会是什么时刻?

  李力耘★★:对★,小鹏非常坚定国际化★★★,未来10年海外销量要占全部销量一半。2024年小鹏的出海非常不错,但我觉得智驾还可以更好。明年,小鹏会根据海外当地的驾驶习惯和法规,把智驾体验按照当地用户喜欢的方向去做★★,提供给当地用户★★★。

  李力耘:方向是笃定的,但我觉得技术变化会非常快★。今年以来,我们也看到了类似于Sora★★★、ChatGPT非常强的AI能力涌现。我们也升级了AI的战略,包括对云端模型Scaling Law的认知,紧跟AI最前沿,然后应用在自动驾驶领域★。