========================
== Seeking Complexity ==
========================

make the world a better place

PUBLIC

哈哈,本来挺好的一个愿景,现在变味了。

平常难免屈从于各种各样的短期目标,过程中也感觉到,做的东西是挺好的,但是又不够好。

还是希望有一个更大更香的胡萝卜在前面。

现在大概有三类大饼,让我真心向往。

自动驾驶:1/10价格的滴滴

2022年大家已经比较趋同地放弃robotaxi的商业可能性了,勇敢地拥抱了竞争激烈的辅助驾驶市场: 好的方面是汽车销量和自动驾驶的渗透率都在超预期上升,坏的方面是同质化严重导致价值集中聚集在品牌方。

我自己并不是从业者,从外人的视角来看,一定存在MTBF到了某个值,使得robotaxi(+ 1vN 遥控员)的成本低于滴滴(+ 1v1 驾驶员)一个数量级。

有几个前置条件:

  • 消费者(包括车厂)是从众的,也就是他看到别人(在有限的时间)是安全的,他也会认为自己是安全的。 这个"看到"要多久,mobileye给出的答案是 \(10^7\) 小时:
  • 现有的范式是足够达到MTBF的,这里用到两个曲线:
    • 模型capacity:算法precision-recall vs data size,对应tesla强调的software 2.0 经过tesla的教育,大家都理解了。

    • 冗余度(逆融合)是什么,也可以说是融合更早发生和更晚发生分别有什么优缺点,对应mobileye强调的True Redundency

      更早地融合,系统更黑盒,更容易有更好的成绩,有利于拟合。 更晚地融合,更平行,更独立,有利于测试。

      有点像一个系统设计,你是从起点开始设计,还是从终点开始设计:

      如果你从起点开始设计,最关心的是如何是现在的系统更好,那么应该要更好的成绩,要更早地融合。

      如果你从终点开始设计,要先关心如何达到给定的测试量:最晚的融合对应的测试量是不同的车,再回一步是,同样的车,两套系统(pure vision & pure lidar),也可以继续回。

      看起来依旧是可以追求的,路子还没有锁死。

家用机器人:自然语言的全任务交互

不得不承认自己对自己之前的想法动摇了,本来觉得抓取的技术都难以跨越,经过ChatGPT的洗礼,AGI的实现又一次被提起。

ChatGPT人格化的回答,给了我一种新的对AGI的理解。如果一个并不具有智慧的agent,实际上,可以接受语言形式的指令,做到难度依次提升的任务:

  1. 人格化的对话
  2. 写一些文字给我
  3. 操作所有的软件
  4. 做一杯咖啡RT-1

是不是已经是一个革命性地AGI实现了。

期待机器学习这些莽夫继续去革命机器人领域。

元宇宙:脱实向虚

我自己是认为这个是我最期待的,我完全不介意我自己的意识脱离自己的肉体,不过这种取向一定是有很大争议的。

人类的终点在哪里呢,盲目猜测现在的生产力,已经足够每个人每周工作一天,过上老友记里面的生活了。

现在的额外工作,很多是为了“新型”的享乐:我要穿更花哨的衣服,我要吃更稀有的动物,我要去没去过的地方,我要更大的房子更流线型的汽车。

这样下来,我们是不是更快乐了?

从这个角度里,元宇宙似乎像是一种残酷的实验,强化更抽象的概念(更强的人和人的连接),弱化更具体的概念(更弱的物质享受)。

扯的有点远了。

现在元宇宙太虚了,太多技术还不成熟,太多应用都流行不起来。

上一次印象深刻的概念还是用video seethrough去实现AR,非常接地气的想法:基本上共享了手机的发展路径(更高分辨率的相机,更强的显示芯片,更HDR的屏幕)。 看好。

总结

都是不太“靠谱”的想法,但是还是希望有生之年能看到,不然现在的这些进展,实在很难相信如何make the world a better place。