一个机械臂,对面站着人类高手,中间隔着一张标准乒乓球台。球飞过来,速度快到肉眼只能看见一道白影。0.3秒,机械臂动了,球被稳稳打回去。对面的人类选手接球、回击、再接球,几个回合下来,球落地了。机械臂赢了这一分。
这个看起来有点简陋却速度飞快的家伙叫Ace,来自索尼AI。Ace是第一个能赢了高水平选手的乒乓球机器人,刚刚登上了Nature。
过去,乒乓球机器人打的是高度简化的“模拟赛”,比如使用发球机代替人类发球、缩小球台面积,甚至不许对手打旋转球。而Ace是实打实地进行了标准比赛:标准的场地,真实的比赛规则,对战人类精英选手。
Ace VS 人类
这件事的意义,远不止“机器人会打乒乓球”这么简单。
乒乓球比赛很难吗?如果你觉得 AI 下棋厉害、打游戏厉害,所以打乒乓球厉害就理所当然,那就是高看它了。棋盘和游戏画面再复杂,本质上都还是数字世界里的事情。屏幕里的棋子不会因为你手抖而掉到地上,游戏角色也不用担心关节会不会撞到桌子。
真正难的,是让 AI 走进现实世界。
乒乓球几乎把机器人最怕的几件事叠在了一起。第一件是快。高水平比赛里,球速可以超过每小时100公里,来回之间不到半秒,也就是眨眼的功夫。第二件是旋转。一个球带不带上旋、下旋、侧旋,会直接改变飞行轨迹和落台后的反弹方式;同样的挥拍动作,面对不同旋转的来球,结果可能完全不一样。
第三件是对抗。对手不是按照固定程序出牌,而是在不断试探你的弱点。回球总是落在左边,他下一板就会盯着你的右边打。这种实时的、有针对性的博弈,比任何预设的训练场景都要复杂。
第四件是物理约束。机械臂有惯性,有速度极限,有关节活动范围的限制,还得时刻避免撞到桌子甚至自己。哪怕 AI 已经算出了“完美动作”,也得确保这个动作在现实中做得到。
把这四件事放在一起,你就明白为什么乒乓球机器人这么难做了。它需要的是感知、决策、控制这一整条链路在极短时间内无缝配合。
Ace 是怎么做到的Ace 的思路可以粗略理解成三层:看、想、动。
Ace 用多台普通相机来定位球在三维空间中的位置,同时用一种特殊的相机“事件相机”来估计球的旋转。
事件相机和常见的摄像头不太一样。普通摄像头是一帧一帧拍的,就像每秒钟截图60次。但对于高速运动的物体来说,这种拍摄方式有两个问题:一是延迟,从拍下这一帧到处理完这一帧,中间总有时间差;二是运动模糊,球动得太快,一帧画面里球已经拖出一条影子,很难看清楚。
事件相机的工作方式完全不同。它不是定时拍照,而是让每个像素点独立工作,哪里的亮度变了,哪里就立刻上报一个“事件”。你可以把它想象成一群时刻值班的哨兵,不是每隔一段时间统一汇报一次,而是一有动静就马上喊出来。这种机制的时间分辨率比普通相机快了好几个数量级。
事件相机捕捉球面亮度变化的细微模式,再通过算法反推出旋转方向和速度,让Ace能“看清”高速的来球是怎么转的。
“想”
工程师不可能穷举所有来球情况,再给每种情况写死一套动作规则,因为来球的速度、旋转、落点组合起来有无数种可能。取而代之的是强化学习,就是让 Ace 在仿真环境里反复练习,用试错的方式去学“面对这样的来球,如果我想把球打成某种落点和旋转,应该怎么挥拍”。
整个学习过程完全在仿真环境里完成,这可以让机器人“死”无数次——撞桌子了,重来;球没接住,重来;动作太慢了,重来。在真实世界里这么试错,机器人早就撞坏了,时间成本更是承受不起。等在仿真里学得差不多了,再把策略迁移到真实的机械臂上即可。

乒乓球机器人的”超级大脑“丨Sony AI
哪怕策略网络已经决定了“要这么打”,也不能直接把一个理想动作硬塞给机械臂。因为理想动作可能要求机械臂在0.1秒内完成一个大幅度的挥拍,但机械臂的电机和关节做不到;或者理想轨迹会让机械臂的某个关节撞到桌子边缘,那就更不行了。
Ace 的做法是,把策略输出先映射成一个短时间窗口里的目标,再交给轨迹优化和安全模块,生成真正可执行的连续运动。换句话说,AI 负责给方向,控制系统负责现实中的实现。

ACE的机械臂有8自由度,回球速度可达19.6米/秒丨Sony AI
这三层配合起来,从看见球到打出球,整个流程被压缩在不到半秒的时间里。而且这不是一次性的动作,而是要在一场比赛中连续执行几十次、上百次,每次都不能出大错。
它到底打得怎么样Ace 和5位超过10年球龄的精英级选手打了比赛,赢下了3场。与2位职业选手时对决时都输了,拿到了1局。不过,它能稳定回击高速和高旋转来球,说明它不是靠运气或者偶然性得分。

Ace今年4月对战了5位精英选手和2位职业选手。在更早的比赛中,曾与日本排名前10、世界排名64的吉村和弘切磋(并输了)。
有意思的是,Ace 的球风和人类不太一样。比如面对极速来球时,人类的本能是后撤以争取反应时间,但 Ace 可以在不退台的情况下守住原位。
人类高手更常靠很猛的上旋和速度直接压死对手,一板球又快又转,对方接不住就直接得分。Ace 的优势更多来自稳定性——它能稳定回球,不会体力不支动作变形,在高速条件下能维持比较高的成功率。你很难用一板爆冲直接打死它,但它也很难用一板爆冲直接打死你。
这反映了机器人和人类各自的优势。人类的优势在于爆发力和创造力,能在关键时刻打出一板质量极高的球。机器人的优势在于一致性和反应速度。
但 Ace 也还有明显的短板。很明显,它还打不过真正顶尖的职业球员。另外人类高手不仅是在回球,更是在读对手、设陷阱、做节奏变化,Ace 现在无法完成战术。
论文作者自己也提到,未来的重要方向包括更强的人类对手建模,以及能从真实互动中持续改进的在线学习。
让机器人打乒乓球,重要吗?如果你关心的只是“机器人会不会抢走人类的体育冠军”,那这篇论文可能没那么激动人心,毕竟 Ace 现在连世排64的选手都还打不过。
但它让我们看到一种新阶段的 AI:不再只在数字空间里推理,而是在物理世界里,以接近人类极限反应速度的节奏,与人互动、对抗、调整。这类能力一旦成熟,影响不会停在球桌边。
想象一下服务机器人的场景。你在厨房里做饭,机器人在旁边帮忙。你说“把那个碗递给我”,机器人需要理解你指的是哪个碗,判断你现在的姿势和位置,然后用合适的速度和角度把碗递到你手边,既不能太慢让你等,也不能太快吓你一跳,更不能撞到你的手。这需要高速的感知-决策-动作闭环。
乒乓球只是第一个足够好看、也足够难的舞台。下一个舞台会是什么,现在还不知道。但可以确定的是,这扇门已经被推开了。
作者:脑子通电
编辑:Luna
封面图来源:Sony AI
点个“小爱心”吧
