令人不安的是，机器狗已经具备这种能力了

使用单一的神经网络实现操纵，是四足机器人领域的一项重大技术突破

跑酷是一项极限运动，需要参与者以高度动态的方式跨越障碍，对于大多数时候「笨手笨脚」的机器人来说，这似乎是件遥不可及的事，不过最近在机器人控制领域里出现了一些技术突破的趋势。几周前，本站曾报道过一个使用强化学习方法让机器狗实现跑酷的研究，实现了不错的效果。

最近，卡内基梅隆大学（CMU）进行了一项新研究，针对机器狗跑酷的挑战提出了一种令人惊叹的新方法，效果进一步提升，以至于人们一致评价为“令人惊叹”

^{观众说：“就像在《黑镜》里演的一样。”}

卡内基梅隆大学的研究使得机器狗能够像障碍赛中的选手一样，自动越过不连续的箱子，并在不同角度倾斜的坡面之间轻松奔跑和跳跃

而且通过这些障碍的速度也很快。

轻松跳过 0.8 米（机器狗长度的 2 倍）的间距：

攀爬超过0.51米高（机器狗高度的2倍）的障碍物：

这回没有一把站稳，它还用后腿进行了补救，动作像真的狗一样。

机器狗还能够完成一些真实世界中动物难以做到的事情，比如只用两条前腿行走，相当于倒立行走

还能仅用两条前腿下楼梯：

就像在游戏中遇到了一个bug一样，有点滑稽，同时又带有一丝恐怖谷效应

该研究的目标是让小型低成本机器狗能够成功完成跑酷任务。这种机器狗的驱动系统不够精确，而且只有一个用于感知的前置深度摄像头，其频率低且容易出现抖动和伪影

该研究提出了一种基于原始深度和机载传感器输入的神经网络，用于直接生成关节角度命令。通过进行大规模的强化学习模拟训练，该方法能够解决由于传感器不准确和驱动器问题所带来的挑战，从而实现端到端的高精度控制行为。该研究项目已经在开源平台上发布

方法简介

该研究通过端到端数据驱动的强化学习框架使机器狗具备「跑酷」的能力。为了让机器狗在部署时根据障碍物类型进行自我调整，该研究提出了一种新颖的双重蒸馏（dual distillation）方法。该策略不仅能输出灵活的运动命令，还可以根据输入深度图像快速调整方向。

为了让单个神经网络能够表征不同的跑酷技能行为，该研究提出了一种基于内积的简单而有效的通用奖励设计原则。

具体来说，该研究旨在训练一个直接从原始深度和机载传感到关节角度命令的神经网络。为了训练适应性运动策略，该研究采用了正则化在线适应（ROA）方法，并针对极限跑酷任务进行了关键修改。

实验结果

该研究的目标是让机器狗掌握4种技能，包括攀爬、跳过间隙、在斜坡上跑跳和倒立。下表1展示了与其他几种方法相比的比较结果

为了验证系统中各部分的作用，该研究提出了两组基线。该研究首先测试了奖励设计和整体流程，结果如下表2所示：

第二组基线的目的是测试蒸馏设置，其中包括用于方向预测的 BC 和用于动作的dagger。实验结果如表3所示

此外，研究还进行了多项现实实验，记录了成功率，并与 NoClear 和 NoDir 基线进行了比较。实验结果如图7所示

感兴趣的读者可以阅读论文原文，了解更多研究内容。

以上就是令人不安的是，机器狗已经具备这种能力了的详细内容，更多请关注php中文网其它相关文章！

声明：本文转载于：机器之心，如有侵犯，请联系admin@php.cn删除

查看更多

相关文章