OpenAI推出计算机视觉系统 能让机器人通过环境交
几个月前,位于旧金山的初创公司Open展示了一种新型的计算机视觉系统——“密集对象网”(Dense Object Nets,简称DON)。这个系统赋予了机器人一种独特的检查、理解和操作物体的能力,即使面对他们从未接触过的物体。这是谷歌研究人员基于自我监督的认知发展研究取得的一次重大突破。
我们的知识来自于与环境的互动。随着时间的推移,我们从行动的结果中学习,从中获取关于世界的知识。即使是执行一个简单的动作,如抓住一个物体,也能提供丰富的信息。例如,物体必须在抓住之前的瞬间处于触手可及的位置。
Jang和Devin在机器人领域的研究中发现了这种学习方式的巨大潜力。这种学习方式使得机器人系统无需大量训练数据或人工监督就能自我学习。在这种自我监督的形式下,机器人能够通过观察场景中的视觉变化来识别物体。
该团队与一家公司合作,训练了一只机械臂,使其能够无意识地抓住物体,并在训练过程中学习各种物体的表现形式。这些表现最终使得研究者能够有意识地控制机械臂,让它选择并抓住特定的工具。
谷歌的机器人团队利用强化学习这一人工智能训练技术,通过驱动系统实现特定的目标,例如让机械臂抓住目标、用相机检查目标,并回答基本的目标识别问题。他们成功开发了一种感知系统,该系统通过分析抓取前的图像、抓取后的图像以及被抓取物体的孤立视图,提取出关于物体的有意义的信息。
在最近的测试中,Grasp2Vec和该团队的新策略取得了令人瞩目的成绩,成功率达到了80%,甚至在多个物体同时出现并需要匹配特定目标的情况下也能有效工作。
研究人员兴奋地说道,他们展示了机器人抓取技能如何生成用于学习以物体为中心的表示的数据。然后,他们使用表示学习来引导更复杂的技能,如实例抓取,同时保留了自主抓取系统的自监督学习特性。展望未来,我们对机器人的发展充满期待,不仅期待它们能通过更好的感知和控制来执行任务,也期待它们能在新的自我监督范式下为机器学习领域带来更多的创新和突破。
技术专区
随着技术的不断进步,机器人和人工智能已经成为当今最激动人心的技术领域之一。从自我学习的计算机视觉系统到创新的机器学习技术,研究人员正在不断突破边界,为我们带来更加智能、高效的机器人系统。未来,我们期待看到更多的创新成果在这个领域涌现,为我们的生活带来更多的便利和乐趣。