Open AI用强化学习算法 教会机械手“盘核桃”

人工智能 2022-04-19

  据国外媒体报道,由马斯克创办的非盈利性人工智能组织Open AI近日展示了一项新的研究成果:让机械手像人手一样精准地操纵物体。

  这套名为Dactyl的机械手系统能够按照指令要求,轻松完成转动立方体的动作,像人手“盘核桃”一样灵活。它之所以能实现如此复杂精妙的指尖操作,和Open AI使用的强化学习算法有关系。他们让机器在虚拟环境中自我学习,在训练过程中增加大量随机事件,让AI在这个过程中自己领悟出完成任务的诀窍。首先,他们会教导机械手按照指令,将六面立方体中的正确颜色翻转出来;然后开始改变周围环境的灯光,以及立方体的颜色、重量和纹理等;甚至还会改变训练过程中的重力环境因素。这种虚拟环境的训练模式不会耗费现实世界的时间。目前Dactyl已积累了大约100年的训练经验,但这个过程只相当于现实世界中的50小时。