保姆级教程：用Jetson Nano和TensorFlow/PyTorch，从零搭建一个能“认人”的ROS跟随小车

张开发

• 2026/5/5 6:18:11 • 15 分钟阅读

分享文章

保姆级教程：用Jetson Nano和TensorFlow/PyTorch，从零搭建一个能“认人”的ROS跟随小车

从零构建ROS智能跟随小车Jetson Nano与深度学习实战指南在智能机器人领域能够自主识别并跟随特定目标的移动平台一直是研究热点。这类系统融合了计算机视觉、深度学习和机器人控制三大技术方向是验证AI算法落地能力的绝佳项目。本文将手把手带您用Jetson Nano开发板和ROS机器人操作系统打造一个能精准识别人体并实现智能跟随的移动小车。这个项目特别适合想要深入嵌入式AI和机器人开发的实践者。不同于简单的Demo演示我们将从硬件组装开始逐步完成环境配置、模型训练、算法集成到最终的运动控制每个环节都会分享实际开发中容易遇到的坑和解决方案。跟随本指南完成后您不仅能获得一个可运行的跟随小车更能掌握工业级机器人开发的核心方法论。1. 硬件选型与系统搭建1.1 Jetson Nano开发板配置作为项目的大脑我们选择NVIDIA Jetson Nano主要基于三点考虑首先其GPU支持CUDA加速可流畅运行轻量级神经网络其次ARM架构功耗低适合移动平台最后完善的社区支持降低了开发门槛。收到开发板后建议按以下步骤初始化系统烧录从NVIDIA官网下载JetPack SDK推荐4.6版本使用Etcher工具写入microSD卡至少32GB首次启动插入SD卡后连接显示器、键鼠完成Ubuntu系统初始化设置基础优化sudo apt update sudo apt full-upgrade -y sudo nvpmodel -m 0 # 启用最大性能模式 sudo jetson_clocks # 解锁时钟频率限制提示长期使用时建议加装散热风扇持续高负载下温度可能超过80℃1.2 传感器与运动平台选型跟随系统需要感知环境和执行运动关键部件选择直接影响最终效果组件类型推荐型号性能参数接口方式摄像头Logitech C9201080p30fpsUSB 3.0电机驱动L298N双路DC电机GPIO PWM底盘4WD智能车套件减速比1:4812V供电测距传感器TFmini Plus0.1-12mUART连接时需特别注意摄像头应安装在小车前端高度约50cm俯角15°为佳电机驱动板需要独立供电避免与Jetson共用电源导致电压不稳所有线缆需用扎带固定防止移动过程中松动2. ROS开发环境配置2.1 安装ROS MelodicJetson Nano推荐使用ROS Melodic对应Ubuntu 18.04安装步骤如下sudo sh -c echo deb http://packages.ros.org/ros/ubuntu $(lsb_release -sc) main /etc/apt/sources.list.d/ros-latest.list sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv-key C1CF6E31E6BADE8868B172B4F42ED6FBAB17C654 sudo apt update sudo apt install ros-melodic-desktop-full echo source /opt/ros/melodic/setup.bash ~/.bashrc source ~/.bashrc sudo apt install python-rosdep python-rosinstall python-rosinstall-generator python-wstool build-essential sudo rosdep init rosdep update2.2 创建工作空间与功能包建立专属的ROS工作环境有利于项目管理mkdir -p ~/follow_ws/src cd ~/follow_ws/src catkin_init_workspace git clone https://github.com/your_repo/follow_robot.git cd .. catkin_make echo source ~/follow_ws/devel/setup.bash ~/.bashrc关键功能包说明robot_driver电机控制与传感器读取vision_pkg视觉处理与目标识别tracking_ctrl跟随算法与PID控制3. 深度学习模型训练与优化3.1 人体检测模型选型在资源受限的Jetson Nano上模型需平衡精度与速度。我们对比了三种轻量级架构MobileNetV3-SSD推理速度快~20ms但小目标检测效果一般YOLOv5n平衡性好支持自定义训练推荐输入尺寸320x320NanoDet专为边缘设备优化模型仅2MB左右以YOLOv5为例训练自定义数据集的典型命令python train.py --img 320 --batch 16 --epochs 50 --data coco128.yaml --weights yolov5n.pt --cache3.2 数据采集与增强高质量的训练数据是模型性能的基础建议采集不同光照条件下的人体正/背面图像多角度、多距离的样本各种服装风格的样本使用Albumentations库进行数据增强import albumentations as A transform A.Compose([ A.RandomBrightnessContrast(p0.5), A.HorizontalFlip(p0.5), A.RGBShift(r_shift_limit15, g_shift_limit15, b_shift_limit15, p0.5), A.RandomShadow(p0.3) ])3.3 模型量化与部署为提升推理速度可采用TensorRT加速import tensorrt as trt # 转换ONNX模型为TensorRT引擎 with trt.Builder(TRT_LOGGER) as builder: with builder.create_network() as network: with trt.OnnxParser(network, TRT_LOGGER) as parser: with open(onnx_model_path, rb) as model: parser.parse(model.read()) engine builder.build_cuda_engine(network)4. 视觉跟随算法实现4.1 单目测距原理基于已知目标高度假设成人肩宽约40cm的测距公式distance (focal_length * real_width) / pixel_width其中焦距可通过标定获得ret, mtx, dist, rvecs, tvecs cv2.calibrateCamera(objpoints, imgpoints, gray.shape[::-1], None, None)4.2 目标跟踪策略采用检测跟踪的混合方案提升鲁棒性当检测置信度0.7时初始化KCF跟踪器跟踪过程中每10帧进行一次检测验证目标丢失时扩大ROI区域重新检测核心跟踪循环代码结构while not rospy.is_shutdown(): ret, frame cap.read() if tracker_init: success, bbox tracker.update(frame) if success: # 计算目标中心坐标 cx bbox[0] bbox[2]/2 cy bbox[1] bbox[3]/2 # 发布目标位置话题 pub.publish(cx, cy)4.3 PID控制参数整定运动控制采用位置式PID算法class PIDController: def __init__(self, Kp, Ki, Kd): self.Kp Kp self.Ki Ki self.Kd Kd self.last_error 0 self.integral 0 def compute(self, error, dt): self.integral error * dt derivative (error - self.last_error) / dt output self.Kp*error self.Ki*self.integral self.Kd*derivative self.last_error error return output典型调试步骤先设Ki0Kd0逐渐增大Kp直到系统出现振荡取振荡时Kp值的50%作为基准引入Ki消除静差从Kp/10开始调整最后加入Kd抑制超调5. 系统集成与性能优化5.1 ROS节点通信架构设计三个主要节点实现功能解耦[摄像头驱动] --image_raw-- [视觉处理] --target_pose-- [运动控制] | v [模型推理服务]话题与服务定义示例# 目标位置消息 geometry_msgs/Point target_pose # 速度控制服务 follow_robot/SetSpeed float32 speed5.2 实时性优化技巧使用rospy.Rate控制循环频率建议15-20Hz图像传输采用compressed_image_transport减少带宽关键节点设置为实时进程sudo chrt -rr 99 rosrun vision_pkg detection_node.py5.3 典型问题排查延迟过大检查nvidia-smi确认GPU利用率使用rqt_graph查看节点通信状态跟随抖动降低PID增益系数增加目标位置滤波如移动平均目标丢失调整检测阈值扩大搜索区域范围在实际测试中我们发现当环境光照变化剧烈时模型的检测稳定性会明显下降。解决方案是增加自适应直方图均衡化CLAHE预处理clahe cv2.createCLAHE(clipLimit2.0, tileGridSize(8,8)) gray cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) gray clahe.apply(gray)

更多文章

前端开发 2026/4/9 7:40:41

Graphic Walker入门教程：5分钟学会拖拽式数据探索分析

Graphic Walker入门教程：5分钟学会拖拽式数据探索分析【免费下载链接】graphic-walker An open source alternative to Tableau. Embeddable visual analytic 项目地址: https://gitcode.com/gh_mirrors/gr/graphic-walker Graphic Walker 作为一款开源的 T…

张开发

前端开发 2026/4/9 7:41:20

3个高效步骤：基于DeepCAD实现AI驱动的CAD模型生成技术指南

3个高效步骤：基于DeepCAD实现AI驱动的CAD模型生成技术指南【免费下载链接】DeepCAD code for our ICCV 2021 paper "DeepCAD: A Deep Generative Network for Computer-Aided Design Models" 项目地址: https://gitcode.com/gh_mirrors/de/DeepCAD …

张开发

前端开发 2026/4/9 7:41:17

4步系统调优法：从问题诊断到长期性能维护的硬件适配指南

4步系统调优法：从问题诊断到长期性能维护的硬件适配指南【免费下载链接】Atlas 🚀 An open and lightweight modification to Windows, designed to optimize performance, privacy and usability. 项目地址: https://gitcode.com/GitHub_Trending/at…

张开发

前端开发 2026/4/9 7:40:43

# 发散创新：基于Python与OpenCV的手势识别系统实战详解在智能交互日益普及的今天，手势识别技术正逐步从实验室走向消费

发散创新：基于Python与OpenCV的手势识别系统实战详解在智能交互日益普及的今天，手势识别技术正逐步从实验室走向消费级应用。无论是VR/AR中的自然操控、智能家居的非接触控制，还是人机协作机器人对操作意图的理解，手势识别都扮演…

张开发

前端开发 2026/4/9 7:40:46

Pixel Couplet Gen部署案例：中小企业春节H5活动AI内容生产闭环

Pixel Couplet Gen部署案例：中小企业春节H5活动AI内容生产闭环 1. 项目背景与价值春节营销是中小企业每年最重要的营销节点之一，而传统H5活动面临两大痛点：内容同质化严重、设计开发成本高。Pixel Couplet Gen通过AI生成像素风格的创新组合…

张开发

前端开发 2026/4/8 8:43:34

基于Java的承包人档案智慧管理系统的设计与实现全方位解析：附毕设论文+源代码

1. 为什么这个毕设项目值得你 pick ? 毕设不用从零敲！基于Java的承包人档案智慧管理系统的设计与实现主要功能模块包括承包人档案管理、水费价格管理、电费价格管理、收费来源管理、水费年月管理、水费收费管理和承包收费管理、电费收费管理，涵盖普通员…

张开发

前端开发 2026/5/5 6:17:46

时序预测实战：基于PyTorch 2.8 与LSTM的股票价格预测案例

时序预测实战：基于PyTorch 2.8与LSTM的股票价格预测案例 1. 引言：当AI遇见金融市场股票市场就像一片波涛汹涌的海洋，无数投资者试图预测下一个浪头的高度和方向。传统技术分析方法往往受限于人类对复杂模式的识别能力，而现代深…

张开发

前端开发 2026/4/12 12:10:51

AI时代深度思考的能力更重要

在AI时代，深度思考已不再是一种可选的智力奢侈，而是个体保持主体性、社会保持健康进化的生命线。AI越是强大，深度思考的价值就越从“工具”升维为“目的”本身。我们可以从以下几个层面理解其“更重要”的深刻原因，以及它如何定义…

张开发

前端开发 2026/4/17 0:42:17

深入解析Nginx：从基础配置到高性能负载均衡实战

1. Nginx基础入门：从安装到第一个Hello World Nginx（发音为"engine x"）是一款高性能的HTTP和反向代理服务器，由俄罗斯工程师Igor Sysoev开发。我第一次接触Nginx是在2013年，当时被它处理高并发的优雅方式所震…

张开发

前端开发 2026/4/9 7:40:50

突破120FPS：RIFE智能插帧技术如何革新视频流畅度体验

突破120FPS：RIFE智能插帧技术如何革新视频流畅度体验【免费下载链接】video2x A machine learning-based video super resolution and frame interpolation framework. Est. Hack the Valley II, 2018. 项目地址: https://gitcode.com/GitHub_Trending/vi/video2…

张开发