当前位置：首页 > 运维知识 > windows >内容正文

windows

【Paper】2022_基于无人驾驶地面车辆的多Agent系统仿真平台的设计及编队控制协议的研究

发布时间：2025/4/5 windows 47 豆豆

生活随笔收集整理的这篇文章主要介绍了【Paper】2022_基于无人驾驶地面车辆的多Agent系统仿真平台的设计及编队控制协议的研究小编觉得挺不错的,现在分享给大家,帮大家做个参考.

分享自己的一篇文章，发布在人工生命与机器人ICAROB2022，欢迎各位引用。

A Design of Multi-Agent System Simulation Platform Based on Unmanned Ground Vehicles and A Research on Formation Control Protocol

文章目录

摘要
1. Introduction
2. Multi-agent system simulation platform
- 2.1. UGV architecture
- 2.2. Communication network
- 2.3. UWB Positioning system
3. Formation algorithm
- 3.1. Consensus protocol
- 3.2. Formation protocol
4. Simulations
- 4.1. Experiment 1
- 4.2. Experiment 2
5. Conclusions

摘要

受自然界中蚂蚁和鱼类的启发，多代理系统（MAS）在现代社会的生产和制造中发挥着巨大作用。本文以无人驾驶地面车辆（UGVs）为对象，设计了一个多车辆测试平台，该平台由UGVs、超宽带（UWB）和蓝牙Mesh组成。同时，UGV可以通过改变主控制器实现不同的控制目标。设计了UGVs的编队控制协议并分析了其稳定性。该协议的有效性通过数值模拟得到了验证。最后，将设计的控制协议应用于开发的硬件测试平台，以验证实验平台的有效性。

1. Introduction

多代理系统（MAS）技术在工业和制造业中发挥着巨大的作用。多代理系统的技术主要是受自然界中的蚂蚁、鱼类、鸟类等的启发，来研究集群个体的应用。从理论上讲，代理可以是任何东西，如UGV、UAV、传感器、机械臂等。

目前，多Agent系统的理论研究已逐渐成熟，如多Agent系统的共识控制1、交会控制2、编队控制3等。但在应用层面，仍有很多地方需要改进。

本文设计了一个多Agent系统的物理仿真平台，以验证其在实际场景中的应用。该平台采用分层结构设计，主要包括通信层、代理层和定位层。通信层主要是建立代理之间的通信通道，使任何一个代理都可以与其他代理进行通信。代理人之间建立通信通道，使任何代理人都能与所有其他代理人进行通信。代理层包含了组成系统的所有个体。定位层在每个代理的定位中起作用。

一个UGV被设计成平台的代理，它可以取代主控制器来匹配不同的编程语言，具有很大的灵活性。然后，解释了蓝牙网状通信技术的原理和UWB定位的原理。

分析了多代理系统的动态共识和静态共识，并在静态共识的基础上设计了系统的静态编队控制协议。最后，进行了数值模拟，以验证所设计的静态编队控制协议的正确性。之后，将静态编队控制协议应用于物理仿真平台，以验证物理仿真平台的有效性。

2. Multi-agent system simulation platform

多代理系统仿真平台由三部分组成：1）代理。代理可以是任何东西，如UGV、UAV、传感器、操纵器等。本文以UGV为例。2）通信网络。代理在工作时需要知道其他代理的状态信息。蓝牙网的目的是建立代理之间的通信渠道。3）UWB定位系统。所有代理的位置状态都来自这个系统。

2.1. UGV architecture

本文以UGV为研究对象，如图2所示。UGV的主控制器可以使用Arduino、STM32和Raspberry Pi。为了实现精确定位，电机脉冲必须处于精确可控的状态，因此编码器返回的脉冲值与PID算法相结合形成闭环控制的PWM输出。为了更方便地调整PID参数，LCD彩色屏幕用来显示编码器的返回值和ADC采集的电池电压。实时采集电压的主要目的是将电机的调节控制在一个固定的电压范围内，避免电流差的影响。

2.2. Communication network

该通信网络采用蓝牙网状技术，芯片型号为E104-BT12NSP。该模块支持Sig Mesh和2.4Ghz蓝牙频段。在组网中，每个节点可以作为代理节点或公共节点，每个节点之间的通信距离可以达到50米。如果一个节点被用作中继，接收到的信号可以被修复和放大，网络的定位可以更大。

2.3. UWB Positioning system

UWB定位技术可应用于室内静态或移动物体和人的定位、跟踪和导航，并能提供非常准确的定位信息。

UWB定位技术采用TOF（飞行时间差）测距。TOF测距方法是一种双向的测距技术。它主要利用两个收发器之间信号的飞行时间来测量节点之间的距离。模块将从一开始就产生一个独立的时间戳。模块A的发射器在其时间戳的A1处发射一个请求的脉冲信号，模块B在时间B2处发射一个响应的信号，模块A在其时间戳的A2处收到这个信号。两个模块之间的脉冲信号的飞行时间可以被计算出来，以确定飞行距离。因为在视线环境下，基于TOF的测距方法与距离有线性关系，所以测量结果会更准确。

3. Formation algorithm

在这一部分，我们首先阐述了UGV的动态模型，然后介绍了普通二阶系统的共识协议，最后构建了基于共识协议的编队控制协议。

由于上面提到的UGV是一个两轮差动车，我们假设UGV在移动时首先调整方向，然后开始移动。这样一来，我们可以使用普通的二阶系统模型作为代理的动力学模型。该系统动力学模型表示为

$p˙i=viv˙i=ui(1)\begin{aligned} \dot{p}_i = v_i \\ \dot{v}_i = u_i \\ \end{aligned} \tag{1}$

其中 $pi=[pxpy]T,vi=[vxvy]Tp_i = \left[\begin{matrix} p^x & p^y \end{matrix}\right]^\text{T}, v_i = \left[\begin{matrix} v^x & v^y \end{matrix}\right]^\text{T}$ 分别表示UGV得位置和速度。 $ui=[uxuy]Tu_i = \left[\begin{matrix} u^x & u^y \end{matrix}\right]^\text{T}$ 是控制输入。

3.1. Consensus protocol

二阶系统的动态共识协议和静态共识协议分别为式（2）和式（3）。
$ui=α∑j∈Ni(pj−pi)+β∑j∈Ni(vj−vi)(2)u_i = \alpha \sum_{j\in N_i} (p_j - p_i) + \beta \sum_{j \in N_i} (v_j - v_i) \tag{2}$

$ui=α∑j∈Ni(pj−pi)−βvi(3)u_i = \alpha \sum_{j\in N_i} (p_j - p_i) - \beta v_i \tag{3}$

其中 $α,β\alpha, \beta$ 是正向增益， $N_i$ 表示节点 $i$ 的邻居。

动态共识协议与静态共识协议的区别在于系统的最终状态是否是静态的，即动态共识的最终速度状态等于但不一定为0，位置处于不断变化的状态，但静态共识的最终速度状态等于0，位置保持静止。

3.2. Formation protocol

基于系统的静态共识协议（3），本文设计了以下静态编队控制协议（4）。

$ui=α∑j∈Ni((pj−hj)−(pi−hi))−βvi(4)u_i = \alpha \sum_{j\in N_i} ((p_j-h_j) - (p_i-h_i)) - \beta v_i \tag{4}$

其中 $hi=[hxhy]Th_i = \left[\begin{matrix} h^x & h^y \end{matrix}\right]^\text{T}$ 是智能体 $i$ 的编队信息。

该协议 (4)可以保证系统在有限的时间内完成编队并保持静止状态。公式（2）也可以改为动态形成协议，但它成为另一种时变形成问题，我们在此暂不讨论。

4. Simulations

在这一部分，我们分别进行了数值仿真实验和仿真平台实验。仿真实验设定为系统有三个代理，其通信关系如图5所示。仿真的最终目标是完成三角形阵列。

4.1. Experiment 1

设置三个UGV的初始状态如下
$p1(0)=[2015]T,v1(0)=[11]Tp_1(0) = \left[\begin{matrix} 20 & 15 \end{matrix}\right]^\text{T}, v_1(0) = \left[\begin{matrix} 1 & 1 \end{matrix}\right]^\text{T}$

$p2(0)=[2010]T,v2(0)=[1−2]Tp_2(0) = \left[\begin{matrix} 20 & 10 \end{matrix}\right]^\text{T}, v_2(0) = \left[\begin{matrix} 1 & -2 \end{matrix}\right]^\text{T}$

$p3(0)=[2020]T,v3(0)=[−21]Tp_3(0) = \left[\begin{matrix} 20 & 20 \end{matrix}\right]^\text{T}, v_3(0) = \left[\begin{matrix} -2 & 1 \end{matrix}\right]^\text{T}$

正向增益为 $α=0.3,β=1.5\alpha = 0.3, \beta = 1.5$ 。编队控制协议为公式（4），图6和图7分别展示了在 X 轴和 Y 轴的仿真结果。

4.2. Experiment 2

在通过数值模拟验证了编队协议的正确性后，编队控制协议（4）被应用于设计的物理模拟平台。

实验平台如图8所示，四个UWB作为锚点分布在实验场地的四个角落，以提供辅助位置信息。还有三个UWB模块安装在UGV上以提供位置坐标。UGV上的蓝牙模块协助通信，使代理人能够获得诸如位置、速度和其他代理人的控制输入等信息。

仿真平台的运行效果如图9所示，显示了三个UGVs在不同时间段的不同位置。实验开始时，三辆UGV排成一线（t=0s），然后由于控制协议的影响，开始逐渐远离（t=15s）。由于速度的影响，距离会很大（t=30s），然后回到预定的队形位置（t=45s），完成三角队形。

5. Conclusions

本文设计了一个多Agent系统仿真平台，并详细介绍了组成仿真平台的三个层次，包括代理层、通信层和定位层。设计了一种UGV，并将UGV作为一个代理来验证仿真平台的有效性。分析了共识控制协议，并在共识协议的基础上设计了编队控制协议，并应用于仿真平台。

下一步，我们将设计不同类型的代理，并将其整合到我们的仿真平台中，以扩大平台的使用范围。

《新程序员》：云原生和全面数字化实践50位技术专家共同创作，文字、视频、音频交互阅读

总结

以上是生活随笔为你收集整理的【Paper】2022_基于无人驾驶地面车辆的多Agent系统仿真平台的设计及编队控制协议的研究的全部内容，希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错，欢迎将生活随笔推荐给好友。

上一篇：【Paper】2022_多无人机系统的分
下一篇：一阶系统单位阶跃响应的特点_第八讲系