在无人机集群项目的算法开发中,推选长机作为集群的动态中心,往往承担着集群管理、通讯中继等重要功能。由于通讯链路的有限性和任务的实时性需要,需要保证动态长机时刻工作正常,并在异常情况下快速切换新长机。
本文主要分享基于braft的长机推选算法。在 ROS2 系统中基于 braft 设计无人机集群的长机推选算法需要结合分布式共识算法和 ROS2 的通信机制。以下是实现该算法的详细步骤。
1 理解 braft 与长机推选
braft
百度开源的分布式一致性算法库,基于 Raft 协议实现,提供领导者选举、日志复制和安全性保障。
长机推选
在无人机集群中动态选择一个 Leader(长机)负责决策,其他无人机作为 Follower(僚机)执行命令。
2. ROS2 与 braft 集成架构
3. 核心实现步骤
步骤 1:创建 ROS2 工作空间和包
mkdir -p ~/drone_ws/src
cd ~/drone_ws/src
ros2 pkg create --build-type ament_cmake drone_leader_election --dependencies rclcpp
cd ~/drone_ws
colcon build --packages-select drone_leader_election
source install/setup.bash
步骤 2:集成 braft 库
在CMakeLists.txt中添加 braft 依赖:
find_package(braft REQUIRED)add_executable(drone_leader_node src/drone_leader_node.cpp)
target_link_libraries(drone_leader_node${rclcpp_LIBRARIES}braft
)
步骤 3:实现长机推选节点
#include <rclcpp/rclcpp.hpp>
#include <braft/raft.h>
#include <braft/node.h>
#include <braft/protobuf_file.h>
#include <drone_msgs/msg/leader_status.hpp>
#include <drone_msgs/msg/drone_command.hpp>// 定义状态机
class DroneStateMachine : public braft::StateMachine {
public:// Raft状态变化回调void on_leader_start(int64_t term) override {RCLCPP_INFO(rclcpp::get_logger("drone_state_machine"), "Become leader on term %ld, I'm the master drone now!", term);is_leader_ = true;publish_leader_status(true);}void on_leader_stop(const butil::Status& status) override {RCLCPP_INFO(rclcpp::get_logger("drone_state_machine"), "Lost leadership: %s, become a follower", status.to_string().c_str());is_leader_ = false;publish_leader_status(false);}// 其他必要实现...private:bool is_leader_ = false;rclcpp::Publisher<drone_msgs::msg::LeaderStatus>::SharedPtr leader_pub_;void publish_leader_status(bool is_leader) {auto msg = std::make_unique<drone_msgs::msg::LeaderStatus>();msg->is_leader = is_leader;msg->drone_id = get_my_drone_id(); // 自定义函数获取本机IDleader_pub_->publish(std::move(msg));}
};// 主节点类
class DroneLeaderNode : public rclcpp::Node {
public:DroneLeaderNode() : Node("drone_leader_node") {// 初始化braft配置init_braft();// 创建ROS2发布者和订阅者leader_status_pub_ = this->create_publisher<drone_msgs::msg::LeaderStatus>("leader_status", 10);command_sub_ = this->create_subscription<drone_msgs::msg::DroneCommand>("drone_command", 10, [this](const drone_msgs::msg::DroneCommand::SharedPtr msg) {if (state_machine_->is_leader()) {// 长机处理命令process_command(*msg);} else {// 僚机转发给长机forward_to_leader(*msg);}});}private:void init_braft() {// 配置braft节点braft::NodeOptions node_options;node_options.initial_conf.parse_from("127.0.0.1:8001,127.0.0.1:8002,127.0.0.1:8003"); // 集群地址// 创建状态机state_machine_ = std::make_shared<DroneStateMachine>();node_options.fsm = state_machine_.get();// 启动braft节点std::string node_id = "drone_" + std::to_string(get_my_drone_id());std::string ip_port = "127.0.0.1:" + std::to_string(8001 + get_my_drone_id());braft::NodeId node_id_obj(node_id, ip_port);node_ = std::make_unique<braft::Node>(node_id_obj);butil::Status status = node_->init(node_options);if (!status.ok()) {RCLCPP_ERROR(this->get_logger(), "Failed to initialize braft node: %s", status.to_string().c_str());}}std::shared_ptr<DroneStateMachine> state_machine_;std::unique_ptr<braft::Node> node_;rclcpp::Publisher<drone_msgs::msg::LeaderStatus>::SharedPtr leader_status_pub_;rclcpp::Subscription<drone_msgs::msg::DroneCommand>::SharedPtr command_sub_;
};int main(int argc, char** argv) {rclcpp::init(argc, argv);auto node = std::make_shared<DroneLeaderNode>();rclcpp::spin(node);rclcpp::shutdown();return 0;
}
步骤 4:定义消息接口
创建 ROS2 消息定义文件:
# 在drone_leader_election包中创建msg目录
mkdir -p ~/drone_ws/src/drone_leader_election/msg
touch ~/drone_ws/src/drone_leader_election/msg/LeaderStatus.msg
touch ~/drone_ws/src/drone_leader_election/msg/DroneCommand.msg
步骤 5:配置 CMakeLists.txt 和 package.xml
在CMakeLists.txt中添加消息生成规则:
find_package(rosidl_default_generators REQUIRED)rosidl_generate_interfaces(${PROJECT_NAME}"msg/LeaderStatus.msg""msg/DroneCommand.msg"
)ament_export_dependencies(rosidl_default_runtime)
4. 算法工作流程
初始化阶段:
所有无人机节点启动 braft 并加入集群。
braft 自动选举出 Leader(长机)。
运行阶段:
长机通过 ROS2 发布LeaderStatus消息。
集群命令由长机接收并处理,僚机转发命令给长机。
braft 保证即使长机故障,也能快速选举新的长机。
故障处理:
当长机离线时,braft 自动触发重新选举。
新长机接管控制权,确保集群连续性。
5. 部署与测试
为每台无人机配置不同的节点 ID 和端口。
启动所有无人机节点,观察日志确认选举结果。
使用rqt_graph可视化节点通信。
通过发送命令测试长机响应和僚机转发功能。
文中提过的机间通讯可以通过话题通讯,也可以在机间采用gRPC或bRPC进行机间信息的交互,其中交互的日志信息不仅实现了长机状态的判断,还实现了数据共享,在长机切换后仍然保留任务管理信息,使得集群任务能够丝滑继续,从而保证了无人机集群任务执行的鲁棒性。
本期无人机自由开发坊关于无人机集群动态长机推举的分享,更多讨论可加入无人机自由开发群(过期可加UavFree95)。