当前位置:首页 > 今日H股公司股市行情 > 正文内容

商汤绝影发布与世界模型协同交互的端到端自驾技术路线R-UniAD

6个月前 (02-23)今日H股公司股市行情16

  2月22日,商汤绝影CEO、商汤科技联合创始人、首席科学家王晓刚在全球开发者先锋大会上发布了“与世界模型协同交互的端到端自动驾驶技术路线R-UniAD”(简称“R-UniAD”)。

  据悉,R-UniAD通过构建世界模型生成在线交互的仿真环境,以此进行端到端模型的强化学习训练,从而实现端到端自动驾驶超越人类的驾驶表现。

  王晓刚表示,端到端的自动驾驶本质是通过海量的高质量人类驾驶数据,来实现最佳的“模仿”驾驶效果。然而,基于模仿学习的技术范式可以做到接近人类但难以突破人类能力上限。同时,受限于高质量场景数据的稀缺性和驾驶数据质量的参差不齐,端到端智驾方案要达到人类驾驶能力的天花板并不容易,动辄千万Clips的高质量数据回流形成了规模门槛。

  不过,今年春节期间,DeepSeek-R1基于纯强化学习的创新引发了广泛关注。通过少量高质量数据的冷启动,模型进行多阶段的强化学习训练,有效降低大模型训练的数据规模门槛,同时,也让尺度定律得以延续,为模型变得更大更强铺平了道路。更重要的是,强化学习能够让大模型自行涌现出长思维链能力,显著提升推理效果。

  王晓刚认为,基于强化学习的大模型技术路线可以迁移到端到端自动驾驶算法的训练与研发中。

  从数据规模来看,多阶段强化学习的训练方法能大幅降低端到端自动驾驶数据规模门槛。R-UniAD就是通过高质量数据进行冷启动,用模仿学习的方式训练出一个端到端基础模型,再通过强化学习方法进行训练。据测算,小样本多阶段学习的技术路线能让端到端自动驾驶的数据需求降低一个数量级。

  从性能上限来看,纯强化学习训练让端到端智驾模型有望通过在提升性能的同时,充分探索多元场景和驾驶风格。未来,端到端智驾体验的上限不再是“类人”,而是可以拥有超越人类的驾驶表现。

  值得注意的是,在今年4月的上海车展,商汤绝影将展示“与世界模型协同交互的端到端自动驾驶方案”的实车部署。

  

(文章来源:上海证券报·中国证券网)

   责任编辑:10 原标题:商汤绝影发布与世界模型协同交互的端到端自驾技术路线R-UniAD

相关文章

淘宝闪购和饿了么再发战报:日订单再破8000万,活跃骑手月均收入超12500元-

淘宝闪购和饿了么再发战报:日订单再破8000万,活跃骑手月均收入超12500元-

  红星资本局7月14日消息,今日,淘宝闪购联合饿了么再发战报,称日订单量再次突破8000万创新高(不含自提及0元购)。其中也提到骑手收入数据,淘宝闪购上线以来,骑手群体的收入显著增长,活...

重磅!腾讯入股华为“天才少年”稚晖君创业的机器人公司

重磅!腾讯入股华为“天才少年”稚晖君创业的机器人公司

        腾讯正式入股“天才少年”稚晖君创...

刘强东送外卖 母亲现身京东食堂给员工煮饺子 网友:没有一点架子

刘强东送外卖 母亲现身京东食堂给员工煮饺子 网友:没有一点架子

  快科技4月27日消息,刘强东亲自送外卖,老母亲也没闲着。   据国内媒体报道,近日,刘强东母亲被拍到在京东食堂帮忙,给员工煮饺子,网友大赞淳朴。  ...

外卖补贴大战“停火” 行业回归理性竞争-理想汽车5月交付量达40856辆

外卖补贴大战“停火” 行业回归理性竞争-理想汽车5月交付量达40856辆

  经历了一段时间激烈的“补贴大战”后,8月1日,美团、淘宝闪购联合饿了么、京东三大外卖平台先后发声H股上市公司,承诺规范促销行为,抵制不正当竞争,这一举动标志着喧嚣一时的外卖大战或迎来终...

高金价下 黄金消费市场冷热交织

高金价下 黄金消费市场冷热交织

     开年以来,金价持续攀升。记者近日走访多地市场发现,黄金消费市场呈现冷热交织、冷暖不均的分化态势:小克重金饰受到欢迎,但大克重金饰消费仍未...

花旗:上调太古A目标价至85港元

花旗:上调太古A目标价至85港元

        花旗维持太古A“买入”评级,目标价由79.25港元上调至85港元...