========================
== Seeking Complexity ==
========================

全自动驾驶的里程碑,吗?

PUBLIC

2023年底(12月20日),Waymo宣布了一项进展:Waymo significantly outperforms comparable human benchmarks over 7+ million miles of rider-only driving

但是(在我看到的范围)并没有引起太多关注。

我反省,似乎又被打脸了(见make the world a better place)。

先简述下这个文章做了什么:

  1. 收集了7.1M的rider-only数据,也就是说没有安全员,简化了这个问题的分析,避免大家认为是安全员的介入提高了数据表现。 具体的范围描述为:

    The Waymo RO ride-hailing service in Phoenix, San Francisco, and Los Angeles operates in fixed geographic areas in these cities operating 24 hours a day and 7 days a week. The ODD includes non-limited access roads with speed limits up to 50 mph and parking lots without restrictions on maneuvers. The ODD does not include severe weather conditions, such as thick fog, heavy rain, or blowing sand but does include light rain or light fog. The ODD for the Waymo RO service has changed slightly over the years as the service expanded. The ODD features have been relatively unchanged in the past year, which also corresponds to the majority of the RO miles accumulated to date.

    简单做个估计:如果有100辆车,去跑7M miles,以50mph /2 = 25mph的速度,大概是需要7M/25/100/24=116.67天,确实是不小的测试量了。(碰巧和mobileye说的测试量很接近啊)。

  2. 收集了若干人类事故记录,以三个类别为重点分析,按照出现频率,依次为:任何事故,警方报告,受伤事故。 这个记录首先引起注意的是,比Waymo大好几个数量级:凤凰城24224M miles,对应第一类事故数IPMM(incidents per M miles)是22.3。

    waymo在凤凰城是5.33M miles,对应第一类事故数IPMM是7.1。

  3. 按泊松分布给了一个置信区间,说不仅7.1比22.3小,按95%的置信区间来看,IPMM是(5.0,9.8),也比22.3小。

  4. 澄清说,waymo是非常诚实地报告所有事故,但是人类粗略估计有60%的仅财产损失和32%的受伤数据根本就没有上报。

有什么结论呢。

看起来是挺有说服力的。

所以这个商业模式兑现了吗?事实上没有。

我的几点猜测,有些存疑,有些待确认:

  1. 场景还是太少,可能需要更多的数据,比如再扩大10倍。事故率比人类明显少一个数量级才行。
  2. 单车成本高。成本来源又有两个常被提到的:
    1. 高精度地图: 虽然这个话题经常被媒体提到。。。 但是我觉得不管怎么说,都是一个固定成本吧,给定城市,而且我也不觉得发展了这么久的工程体系可以简单的用技术路线来二元分类(激光路线vs视觉路线、高精度地图路线vs众包地图路线)。

      只要单车盈利,应该不是问题。

    2. 单车传感器:同上,不觉得是问题。

    3. 工程师处理cornercase的投入:有一种说法是,换个城市,要处理的case完全不一样,如果是这样,最糟糕的情况就是每扩大一个城市,就要多一套程序员(甚至指数上升)。 是有这个可能。我觉得这个我没法反驳。希望有一线经验的同学可以分享一下。 如果这样,就是说视觉模型,和Scaling Laws for Neural Language Models不一致。确实也记得有地方提到这个说法。

  3. 法规接受程度慢。本来想找一下现在Waymo车的数目,公开渠道看到只有"more than 300"。那确实不够多。
  4. 体验不好,这个应该很容易否定吧。事实上,karpathy在Self-driving as a case study for AGI中提到,其实对他来说,一个真无人的乘坐体验是更好的。 (一个插曲是发现karpathy把这个文章删除了。。。不知道为什么)

综上所述,这次是黎明前的黑暗还是狼来了?