当前位置: 首页 > ops >正文

Tello无人机与LLM模型控制 ROS

Tello 无人机大模型控制

这个项目是我们开出来的一个项目,用 LLM+tools 的方式控制 DJI Tello 无人机运动,由于是已经开源出来的项目,因此建议直接跳转至我们的项目链接,所有的更新与 Bug 修复都会第一时间同步上去,博客的更新可能存在滞后。

  • Tello LLM ROS:https://github.com/GaohaoZhou-ops/Tello-LLM-ROS

这篇博客就直接复制项目中 ReadMe-CM.md 中的内容。


News

  • 2025年08月17日-星期日:我们对整个工程进行了重构,将LLM调用节点、LLM输出执行节点、Tello仿真与真机驱动节点进行了剥离,详情可直接前往工程链接;

Tello LLM ROS

这个仓库实现了在 ROS 框架下使用 LLM 对 Tello 无人机进行控制,并以自然语言指令作为输入。当前的版本仅支持通过本地 Ollama 模型的调用,我们正在测试使用在线模型和 Agent 系统的调用方式,一旦完成测试我们将在第一时间更新仓库。

当前我们仅在 Nvidia Jetson Orin 64GB DK 这个硬件上开展了实验,未来我们会尝试在更丰富的硬件设备上进行测试。实验环境的系统与库信息如下:

在这里插入图片描述

在此基础上我们对多个不同的本地模型性能与表现进行了评估,测试样本可以查看脚本 src/tello_llm_ros/scripts/test_llm_offline.py_define_test_cases 函数的内容:

Model准确率平均响应时长 s平均生成速度 tokens/s
Qwen3:4b
Qwen3:8b60.00%52.24540.684
Qwen3:14b
CodeLlama:7b30.00%3.265441.44
Llama3.1:8b
DeepSeek-r1:1.7b
DeepSeek-r1:8b

根据我们的测试结果来看,大部分模型的错误率过高的原因在于频繁生成 takeoffland 命令,说明本地小参数量模型对长程任务的理解仍然有限,尽管我们已经在系统提示词中添加了前提条件。如果你想要避免每条指令都触发无意义的升降,那么一个可选的方案是做关键词删除,但这种操作可能会导致一些本身带有起降含义的命令失效;

为了尽可能降低整体系统响应时长,我们对一些明确指令采取直接调用的形式,这些指令不会输入模型进行推理,例如 takeoff。你也可以添加更多直接运行的指令,修改 config/llm_tools.json 文件中 direct_triggers 字段如下所示,takeofftake offlaunch 这三条指令都是可以直接响应的:

    {"name": "takeoff","description": "Initiates the drone's automatic takeoff sequence...","direct_triggers": ["takeoff","take off","launch"],"parameters": [],"ros_service": "/takeoff","service_type": "Trigger"},

Step1. 安装依赖库

1.1 安装基础依赖库

在运行之前你可能需要安装包括但不限于以下依赖库:

$ conda install libffi==3.3

1.2 创建conda环境

$ conda create -n tello python=3.8
$ conda activate tello
$ pip install -r requirements.txt

Step2. 源码编译

进入到你的工程中拉取源码,这里假设为 tello_ws

$ cd tello_ws/src
$ git clone https://github.com/GaohaoZhou-ops/Tello-LLM-ROS.git

拉取完成后即可执行编译:

$ cd tello_ws
$ catkin_make

Step3. 拉取模型

你可以通过下面的命令拉取 Ollama 开源的模型,这里以 Qwen3:8b 为例:

$ ollama pull qwen3:8b

如何使用

我们提供了多种使用模式,包括真机与模型联合测试、模型独立测试、模型与mock联合测试。

如果你想要通过 XBox 手柄对无人机实现控制,可以使用我们另一个开源仓库:

  • XBox Controller Reader: https://github.com/GaohaoZhou-ops/XboxControllerReader

停止多余模型

在调用模型前,为了避免资源被未关闭的模型抢占,你可以通过下面的命令来关停正在运行的模型:

$ ollama ps
$ ollama stop codellama:7b

在这里插入图片描述

修改系统提示词

众所周知,系统提示词对模型的性能表现影响很大,尽管工程中的系统提示此内容已经经过了多次打磨,但并不一定适合你的任务。如果你发现模型在表现上无法令人满意,那么可以通过修改系统提示词的方式给模型指令约束。修改文件 scripts/llm_utils.py 中的 create_system_prompt 函数:

def create_system_prompt(tools_config):"""Dynamically builds the system prompt using the loaded tools config.This function is now the single source of truth for the system prompt.:param tools_config: The loaded tools configuration dictionary.:return: The formatted system prompt string."""prompt = """You are a simple robot command translator. Your ONLY job is to break down a user's request into a list of simple, one-line text commands for a drone, based on the tools provided.
...

在提示词中有下面几条规则用来防止无人机频繁起降:

**RULES:**
- **CRITICAL**: The final command sequence MUST be enclosed between `[START_COMMANDS]` and `[END_COMMANDS]` tags.
- Inside the tags, output ONLY the command text, with each command on a new line.
- By default, the drone is already in the air and no additional takeoff call is required, unless there is a clear takeoff instruction.
- Unless there is a clear landing instruction, the land command cannot be called.

添加工具

我们也将工具功能提取出来并保存到一个 json 文件中,你可以通过修改 config/llm_tools.json 文件以添加工具:

  "tools": [{"name": "takeoff","description": "Initiates the drone's automatic takeoff sequence...","direct_triggers": ["takeoff","take off","launch"],"parameters": [],"ros_service": "/takeoff","service_type": "Trigger"},// ...]

测试模型性能

在正式开始之前,我们强烈建议先用我们提供的测试节点测试一下模型在你当前设备上的性能与效率,如果成功率太低或者平均任务反应时长太长,那么建议更换模型。

$ cd tello_ws
$ source devel/setup.bash
$ roslaunch tello_llm_ros test_llm.launch

在这里插入图片描述

本地模型+仿真测试

在确认好使用的模型后,可以先以 mock 模式运行来测试当前模型的表现是否是你预期的效果,因为测试案例涵盖的样本太少。

  • 修改 launch/tello.launch 文件中 use_sim 字段为 true 启用仿真:
<arg name="use_sim" default="true" doc="Set to true to run in simulation mode"/>
  • 修改 launch/llm_interface.launch 文件中 ollama_model 字段为你想要运行的模型:
<arg name="ollama_model" default="qwen3:4b" doc="The Ollama model to use"/>

打开一个终端运行仿真器:

$ cd tello_ws
$ source devel/setup.bash
$ roslaunch tello_llm_ros tello.launch

在这里插入图片描述

新开一个终端运行模型交互窗口,通过输入 quit 退出节点:

$ cd tello_ws
$ source devel/setup.bash
$ roslaunch tello_llm_ros llm_interface.launch

在这里插入图片描述

本地模型+真机测试

如果你的模型表现达到你的预期,接下来就可以使用真机进行测试:

  • 修改 launch/tello.launch 文件中 use_sim 字段为 false 启用真机:
<arg name="use_sim" default="true" doc="Set to true to run in simulation mode"/>
  • 修改 launch/llm_interface.launch 文件中 ollama_model 字段为你想要运行的模型:
<arg name="ollama_model" default="qwen3:4b" doc="The Ollama model to use"/>

打开一个终端运行真机:

$ cd tello_ws
$ source devel/setup.bash
$ roslaunch tello_llm_ros tello.launch

新开一个终端运行模型交互窗口:

$ cd tello_ws
$ source devel/setup.bash
$ roslaunch tello_llm_ros llm_interface.launch
http://www.xdnf.cn/news/17947.html

相关文章:

  • 安全审计-iptales防火墙设置
  • 立体匹配中的稠密匹配和稀疏匹配
  • 教材采购管理系统(java)
  • 力扣(接雨水)——基于最高柱分割的双指针
  • Python - 100天从新手到大师:第十一天常用数据结构之字符串
  • Flink Stream API 源码走读 - 总结
  • 双指针和codetop复习
  • Day56 Java面向对象10 方法重写
  • Vue组件基础解析
  • [系统架构设计师]系统质量属性与架构评估(八)
  • Python语言---OrangePi全志H616
  • MySQL锁机制:悲观锁VS乐观锁详解
  • vector 手动实现 及遇到的各种细节问题
  • Azure AI Search 探索总结
  • 通配符 重定向 管道符
  • 数字分类:机器学习经典案例解析
  • vscode中使用CMake Tools生成compile_commands.json文件后,如何告诉clangd这个文件在哪里呢?
  • 【Linux系统】进程间通信:System V IPC——共享内存
  • 23. CommonJS 和 ES6 Module 区别
  • [1Prompt1Story] 生成行为控制器 | 语义向量重加权(SVR)
  • 【计算机视觉与深度学习实战】03基于Canny、Sobel和Laplacian算子的边缘检测系统设计与实现
  • Day11 栈与队列part2
  • duiLib 实现鼠标拖动状态栏时,窗口跟着拖动
  • webrtc弱网-VideoSendStreamImpl类源码分析与算法原理
  • 《Leetcode》-面试题-hot100-技巧
  • 嵌入式硬件篇---常见的单片机型号
  • 按键及消抖
  • Python环境下载安装、以及环境配置教程(Windows版)
  • java项目怎么实现用户行为分析、漏斗转化、数据可视化报表。
  • C语言零基础第18讲:自定义类型—结构体