【摘要】 实践是完美的-这是一句格言,已帮助人类变得高度灵巧,现在它已被应用于机器人。 利兹大学的计算机科学家正在使用自动计划和强化学
实践是完美的-这是一句格言,已帮助人类变得高度灵巧,现在它已被应用于机器人。
利兹大学的计算机科学家正在使用自动计划和强化学习的人工智能(AI)技术来训练机器人,以在杂乱的空间(例如仓库架子或冰箱)中找到物体,然后移动它。
目的是发展机器人自主权,以便机器可以评估任务中出现的独特情况并找到解决方案,类似于将技能和知识转移到新问题上的机器人。
利兹大学的研究人员今天(11月4日,星期一)在中国澳门举行的智能机器人与系统国际会议上介绍他们的发现。
最大的挑战是,在狭窄的区域中,机械臂可能无法从上方抓取物体。取而代之的是,它可能必须计划一系列移动以到达目标对象,也许是通过操纵其他项目来实现。计划此类任务所需的计算机功能非常强大,机器人通常会暂停几分钟。并且当它执行移动时,通常会失败。
不断发展实践的想法非常完美,利兹的计算机科学家将AI的两个想法融合在一起。
一种是自动化计划。机器人能够通过视觉系统看到问题,实际上是图像。机器人操作系统中的软件模拟了到达目标对象可能执行的一系列动作。
但是,机器人预演的模拟无法捕获现实世界的复杂性,并且在实施模拟时,机器人无法执行任务。例如,它可以将物品从架子上敲下来。
因此,利兹团队已将计划与另一种称为强化学习的AI技术结合在一起。
强化学习涉及计算机的一系列尝试和错误尝试(总计约10,000次),以达到并移动对象。通过这些尝试和错误尝试,机器人可以学习其计划好的动作更有可能成功结束。
计算机自己进行学习,首先随机选择可能有效的计划动作。但是,随着机器人从反复试验中汲取教训,它变得更加善于选择那些更有可能获得成功的计划动作。
计算学院的Matteo Leonetti博士说:人工智能擅长使机器人进行推理-例如,我们已经看到与宗师一起参与下棋的机器人。
但是机器人不能很好地完成人类擅长的事情:高度灵活和灵巧。那些物理技能已经硬连接到人脑中,这是进化的结果以及我们实践和实践的方式。
这就是我们将其应用于下一代机器人的想法。
根据撰写研究论文的博士生Wissam Bejjani的说法,该机器人具有一种概括能力,可以将其计划应用到独特的情况下。
他说:我们的工作意义重大,因为它将计划与强化学习相结合。许多尝试开发该技术的研究都只是其中一种方法。
我们的方法已经在大学的机器人实验室中看到的结果得到验证。
有一个问题,在机器人必须移动一个大苹果的情况下,它首先要移到苹果的左侧以移开杂物,然后再操纵苹果。
这样做的目的是使杂物不会落在架子的边界之外。
计算学院副教授Mehmet Dogar博士也参与了这项研究。他说,这种方法将机器人的思考时间缩短了十倍-花费50秒的决定现在需要5秒。
该研究获得了英国工程和物理科学研究委员会的资助,该项目旨在研究机器人技术中的类人物理学。