解析:机器人系统架构有哪些特殊技巧?

标签: 机器人 | 发表时间:2016-12-19 12:20 | 作者:
出处:http://www.leiphone.com

雷锋网按:本文作者Top Liu,易科机器人实验室系统设计师,机器人技术传播者,译著有《机器人编程实战》、《嵌入式机器人学》等。雷锋网独家发布,转载请联系授权。

机器人编程涉及控制系统的设计与实现,包括环境感知、交互、移动及行为的控制。

一个理想的机器人编程过程包括(假定硬件已经一切就绪):

1.系统架构设计

2.具体功能的算法实现

3.编码与集成

由于笔者所从事工作性质,主要集中在:1.系统设计和2.算法的研究上,3.coding的机会并不是很多。第二个原因是:如果1、2工作完成后,3的工作其实和机器人本身并不大,计算机专业恐怕会做的更好。因此本文主要就1给出一些总结和建议。另外,由于所研究的算法过(wu)于(fa)先(ying)进(yong),通常会在专业的学术期刊上发表,在此也不做过多讨论。

一、机器人系统架构

“架构可定义为组件的结构及它们之间的关系,以及规范其设计和后续进化的原则和指南。简言之,架构是构造与集成软件密集型系统的深层次设计。”

系统架构也可称其为如何实施解决方案的一个策略性设计(例如基于组件的工程标准、安全)和解决方案做什么的功能性设计(如算法、设计模式、底层实现)。

图1 机器人功能分解

另外, 软件工程的基本要求包括模块化、代码可复用、功能可共享。使用通用的框架,有利于分解开发任务及代码移植。机器人软件同样遵从软件工程的一般规律。说白了,架构就是你如何把机器人的功能打散,再如何把代码组织起来。 一个清晰的与项目相匹配的架构直接决定了你的开发效率甚至最终功能的成败。

从人类第一台可编程的机器人开发伊始,架构问题就与之相伴而生。早在1996年,Garlan 和 Shaw在《软件架构:一门新兴学科的展望》就总结了移动机器人的基本设计需求, 如:(1) 慎思规划和反应式行为;(2)容许不确定性;(3)考虑危险;(4)灵活性强。针对这些要求,他们评估了四种用于移动机器人的架构,包括控制回路(control loop)、分层(layers)、隐式调用(implicit invocation)、黑板(blackboard)。经过了几十年的实践,一些架构被逐渐淘汰,一些架构逐渐被完善起来。

注意:现在很多机器人开发者一上手就是ROS,虽然ROS是一种比较不错的系统架构,它的基于node的思想在当时是非常先进的,在今天已成为主流。但我们也要清楚,它只是其中一种架构,尤其是在小型嵌入式设备上定制机器人系统时,其他的架构可能会更有效率。另外Master中央控制模式,也是单机时代的产物,在多机的情形就不是很适用。

| 1.S-P-A结构

图2 机器人的“see-think-act”工作模式

 

图3 “传感——计划——行动”(SPA)结构

机器人天然的工作模式是“see-think-act”,所以自然而然的就形成了 “传感——计划——行动”(SPA)结构:从感知进行映射,经由一个内在的世界模型构造,再由此模型规划一系列的行动,最终在真实的环境中执行这些规划。与之对应的软件结构称为 经典模型,也称为层次模型、功能模型、工程模型或三层模型,这是一种由上至下执行的可预测的软件结构,

SPA机器人系统典型的结构是中建立有三个抽象层,分别称为 行驶层(Pilot)(最低层)、 导航层(Navigator)(中间层)、 规划层(Planner)(最高层)。传感器获取的载体数据由下两层预处理后再到达最高“智能”层作出行驶决策,实际的行驶(如导航和低层的行驶功能)交由下面各层执行,最低层再次成为与小车的接口,将驾驶指令发送给机器人的执行器。

缺点:这种方法强调世界模型的构造并以此模型规划行动,而构造符号模型需要大量的计算时间,这对机器人的性能会有显著的影响。另外,规划模型与真实环境的偏差将导致机器人的动作无法达到预期的效果。

| 2.基于行为的结构

 

图4 基于行为的结构

由于SPA系统过于死板,出现了另一种实现方法: 基于行为的方法。基于行为方法前身是反应式系统,反应式系统并不采用符号表示,却能够生成合理的复合行为。基于行为机器人方案进一步扩展了简单反应式系统的概念,使得简单的并发行为可以结合起来工作。

小历史:Joe Jones和Daniel Roth于2003年出版的《Robot Programming:A Practical Guide to Behavior-Based Robotics》以及使用基于行为系统的iRobot扫地机器人的大获成功(通过基于行为的系统可有效实现遍历、避免在某处卡死等多个目标的达成),标志着当年基于行为系统结构的统治地位。短短十年间,SLAM的迅速兴起,基于地图的规划和导航再次兴起,很多人似乎忘记了或压根就没听说过Behavior-Based Robotics的存在。

图5 《基于行为的机器人编程》

基于行为的软件模型是一种由下至上的设计,因而其结果不易预测,每一个机器人 功能性(functionality)被封装成一个小的独立的模块,称为一个“行为”,而不是编写一整个大段的代码。因为所有的行为并行执行,所以不需要设置优先级。此种设计的目的之一是为了易于扩展,例如便于增加一个新的传感器或向机器人程序里增加一个新的行为特征。所有的行为可以读取载体所有传感器的数据,但当归集众多的行为向执行器产生单一的输出信号时,则会出现问题。

最初的行为之间使用固定的优先级,而在现代的应用中则采用更加灵活的选择方案。

“基于行为机器人学”主要特点包括(参见《嵌入式机器人学》):

1)感应与动作的紧密耦合

在某种程度上,所有行为机器人的动作是对刺激的反应而不是依赖于有意识的规则。回避使用思考规划,取而代之的是一些计算简化的模块来实现从输入到执行的映射,此举有利于快速响应。基于这个观察Brooks言简意概的表达出来其中的原理——“规划不过是一种回避计算下一步要做什么的方法”。

2)避开知识的符号表示

对环境的处理上不需要构造一个内部模型以用于执行规划任务,而是 采用真实世界“它自己最好的模型”。机器人直接从观测中获取到未来的行为,而非试图去生成一个能够内部操作的世界的抽象表示并以此作为规划未来行动的基础。

3)分解成具有因果意义的单元

行为按照状态——动作成对出现,设计为对特定的状态做出确定的动作响应。

4)并发关联行为的时变等级调整

为适应所要达成任务目的,在运行期间采用一个控制方案来改变行为的激活等级。

5)行为选择

在基于行为系统中运行着一定数目作为并行进程的行为,每一个行为可以读取所有的传感器(读动作),但只有一个行为可获得机器人执行器或行驶机构的控制权(写动作)。因此需要一个全局控制器在恰当的时机来协助行为选择(或是行为激活、或是行为输出融合)以达到预期的目的。这将系统的设计工作,就从描述系统本身转移到定义一个正常工作的系统的输出上。

说多了,感觉要跑题了。如果你有兴趣,并想了解更多关于编程机器人来处理未知的东西,推荐Ronald Arkin的《Behavior-Based Robotics》和Thomas Braun的《嵌入式机器人学:基于嵌入式系统的移动机器人设计和应用》。慎思式的机器人编程方法,从中级到高级的探讨,推荐Christopher A. Rouff等人的《Agent Technology from a Formal Perspective》。

一张图小结一下

二、混合系统:实践的产物

没有万灵的结构,混合系统结合了SPA和反应体系的原理,将多种混合系统应用于在传感器和电机输出间进行协调来完成任务。混合结构相结合最具吸引力的好处可能是:系统按照有利于完成任务的标准进行设计,而非刻板的遵循某一教条。但再复杂的机构,基本上也都是二者的组合。以ROS的导航包为例:

图6 ROS导航包

导航包整体上是SPA结构,左右两侧是感知S,包括传感器数据/里程计/地图等,中间框图是Global和Local两级规划P,最后发送cmd_vel给行动A。

如果世界是完美的,那按照规划的地图行进到目的地就完事了。然而基于行为方法就是为了处理各种意外而生的。当机器人遇到障碍物或是被卡住的时候,内嵌的基于行为的系统就开始发挥作用。会根据情况,在“行为库”recovery_behaviors中调用某一预先设定的“行为”来摆脱困境。

图7 recovery_behaviors

默认的行为是:首先,清除机器人地图指定区域以外的障碍。接下来,如果可能的话,机器人将执行一个原地旋转清理空间。如果这也失败了,机器人将更激进地清理地图,清除一切可以原地旋转的矩形区域以外的障碍。这将是另一个就地旋转紧随其后。如果这些都失败了,机器人将认为其目标不可行,停止运行并通知用户。

当然,你还可以针对各种意外设计更为复杂的recovery_behaviors “行为库”以备调用。

三、安全自主机器人应用框架

现在还有一种基于场景和态势的设计框架SARAA,我觉得很有趣。 安全自主机器人应用架构(SARAA,Safe Autonomous Robot Application Architecture, SARAA)是一种强调安全性的自主机器人的开发方法。

图8 SARAA

SARAA机器人总结

在《机器人编程实战》(2017年出版)书中,详细介绍了编程一个机器人自主执行其任务、构成了所谓SARAA的7项技术:

软件机器人框架

ROLL模型

REQUIRE

RSVP

SPACES

STORIES

PASS

我们称具有这种体系结构的机器人为SARAA机器人。当正确地实现时,这些编程技术产生一个基于知识的机器人控制器。因此,一个SARAA机器人是一个可以在预先设定的场景和态势中自主行动的知识型机器人。其中一个设计思想是根据场景和态势对前提/后置条件的判断以提高安全性。

感兴趣可访问 Ctest实验室,SARAA已经用于在开源机器人平台内工作,例如Arduino、Linux和ROS。如果对编程SARAA机器人的场景和态势很好理解与恰当定义,则SARAA机器人的设计有助于提升机器人的安全性。

相关 [解析 机器人 系统架构] 推荐:

解析:机器人系统架构有哪些特殊技巧?

- - 雷锋网
雷锋网按:本文作者Top Liu,易科机器人实验室系统设计师,机器人技术传播者,译著有《机器人编程实战》、《嵌入式机器人学》等. 雷锋网独家发布,转载请联系授权. 机器人编程涉及控制系统的设计与实现,包括环境感知、交互、移动及行为的控制. 一个理想的机器人编程过程包括(假定硬件已经一切就绪):. 由于笔者所从事工作性质,主要集中在:1.系统设计和2.算法的研究上,3.coding的机会并不是很多.

深入解析物联网操作系统(架构/功能/实例分析)

- - IT瘾-geek
1.       物联网的主要特点.                        i.             连接. 所谓连接,指的是各种各样的终端设备,都能够通过某种网络技术,连接到一个统一的网络上. 下一代的基础通信网络,包括未来的5G,通信网络架构重构等,为物联网提供泛连接网络是核心目标.

HBase 系统架构

- - 博客园_首页
HBase是Apache Hadoop的数据库,能够对大型数据提供随机、实时的读写访问. HBase的目标是存储并处理大型的数据. HBase是一个开源的,分布式的,多版本的,面向列的存储模型. 5 可在廉价PC Server搭建大规模结构化存储集群. HBase是Google BigTable的开源实现,其相互对应如下:.

Facebook 的系统架构

- Ivan - 博客园新闻频道
  来源:http://www.quora.com/What-is-Facebooks-architecture (由Micha?l Figuière回答).   根据我现有的阅读和谈话,我所理解的今天Facebook的架构如下:. Web 前端是由 PHP 写的. Facebook 的 HipHop [1] 会把PHP转成 C++并用 g++编译,这样就可以为模板和Web逻贺业务层提供高的性能.

Digg.com 的系统架构

- - 标点符
在过去的几年间,我们一直致力于重构Digg的架构,现在我们称之为“Digg V4”.本文我们将全面介绍Digg的使用的系统和技术. 首先,我们来看下Digg给大众用户提供的服务吧:. 人们通过浏览器或者其他应用来访问这些Digg服务. 一些有Digg账户的用户,可以得到“我的新闻”. 每位用户可以得到的我们称之为“热门新闻”.

系统架构师JD

- - CSDN博客架构设计推荐文章
国内大型的物流企业,专业从事国内公路运输和航空运输代理. Foss项目的架构设计,包括需求分析,模块设计,系统结构设计,关键功能的开发,技术难题的解决,对团队质量输出的把控等等. 1、熟悉WebLogic/Websphere/JBoss等一个以上大型应用服务器,熟悉Linux及应用服务器集群. 2、 具有丰富J2EE架构设计经验,具有大型基于J2EE体系结构的项目规划、系统架构设计、开发经验.

Android 系统架构分析

- - CSDN博客移动开发推荐文章
Android:开源的 Linux + Google 的封闭软件 + 私有的基带 + 运营商锁定 = 开放的 Android 手机. iPhone:开源的 BSD + 苹果的闭源软件 + 私有的基带 + 运营商锁定 = 封闭的苹果 iPhone. 一个平庸的应用商店,开发者依靠广告赚钱,商店并非独此一家,用户找不到好软件.

twitter系统架构分析

- - 企业架构 - ITeye博客
twitter系统架构分析. (一)twitter的核心业务. twitter的核心业务,在于following和be followed:. (1)following-关注. 进入个人主页,会看到你follow的人发表的留言(不超过140个字),这是following的过程;. (2)followed-被关注.

支付宝系统架构

- - 编程语言 - ITeye博客
支付宝的开源分布式消息中间件–Metamorphosis(MetaQ). Metamorphosis (MetaQ) 是一个高性能、高可用、可扩展的分布式消息中间件,类似于LinkedIn的Kafka,具有消息存储顺序写、吞吐量大和支持本地和XA事务等特性,适用 于大吞吐量、顺序消息、广播和日志数据传输等场景,在淘宝和支付宝有着广泛的应用,现已开源.