长生栈 长生栈
首页
  • 编程语言

    • C语言
    • C++
    • Java
    • Python
  • 数据结构和算法

    • 全排列算法实现
    • 动态规划算法
  • CMake
  • gitlab 安装和配置
  • docker快速搭建wordpress
  • electron+react开发和部署
  • Electron-创建你的应用程序
  • ImgUI编译环境
  • 搭建图集网站
  • 使用PlantUml画时序图
  • 友情链接
关于
收藏
  • 分类
  • 标签
  • 归档
GitHub (opens new window)

Living Team

编程技术分享
首页
  • 编程语言

    • C语言
    • C++
    • Java
    • Python
  • 数据结构和算法

    • 全排列算法实现
    • 动态规划算法
  • CMake
  • gitlab 安装和配置
  • docker快速搭建wordpress
  • electron+react开发和部署
  • Electron-创建你的应用程序
  • ImgUI编译环境
  • 搭建图集网站
  • 使用PlantUml画时序图
  • 友情链接
关于
收藏
  • 分类
  • 标签
  • 归档
GitHub (opens new window)
  • 计算机视觉

    • 基本环境搭建
    • 数据集制作-FFMPEG从视频提取关键帧
    • 数据集制作-图像分类
    • 数据集制作-目标检测
      • 图像分类数据集结构(以 YOLOv8 为例)
        • 数据集目录结构
        • 标注文件格式(.txt)
        • 归一化坐标计算
        • 配置文件 data.yaml
        • 关键注意事项
        • 标注工具推荐
    • 数据集制作-LabelImg的使用
    • ResNet50部署和微调
    • MobileNet部署和微调
    • YOLO部署和微调
    • Janus-Pro部署和使用
  • ESP32开发

  • Linux系统移植

  • 快速开始

  • 编程小知识

  • 技术
  • 计算机视觉
DC Wang
2025-06-07
目录

数据集制作-目标检测

# 数据集制作-目标检测

目标检测是计算机视觉领域的一个重要研究方向,其核心任务是从图像中检测出目标物体,并对其进行分类、定位、跟踪等。本文将介绍目标检测数据集(YOLO为例)的制作方法。

# 图像分类数据集结构(以 YOLOv8 为例)

以下是YOLO数据集的标准结构及核心规范说明(以YOLOv5/v8为例):


# 数据集目录结构

dataset_root/                  # 数据集根目录
├── images/                    # 图像文件夹
│   ├── train/                 # 训练集图像
│   │   ├── img1.jpg
│   │   └── ...
│   ├── val/                   # 验证集图像
│   └── test/                  # 测试集图像(可选)
│
├── labels/                    # 标注文件夹
│   ├── train/                 # 训练集标注文件
│   │   ├── img1.txt
│   │   └── ...
│   ├── val/                   # 验证集标注文件
│   └── test/                  # 测试集标注文件(可选)
│
└── data.yaml                  # 数据集配置文件
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

# 标注文件格式(.txt)

每行描述一个目标对象,格式为: <class_id> <x_center> <y_center> <width> <height> ​​参数说明​​:

字段 含义 取值范围
class_id 类别索引(整数,从0开始) 0,1,2,...
x_center 边界框中心点x坐标(相对图像宽度比例) [0, 1]
y_center 边界框中心点y坐标(相对图像高度比例) [0, 1]
width 边界框宽度(相对图像宽度比例) [0, 1]
height 边界框高度(相对图像高度比例) [0, 1]

示例标注: 0 0.45 0.63 0.12 0.25 → 表示类别0的目标,中心点位于(45%宽度, 63%高度),宽占图像12%,高占25%。


# 归一化坐标计算

若图像尺寸为 1000×800 像素,实际边界框参数为:

  • 左上角坐标 (x_min=200, y_min=300)
  • 右下角坐标 (x_max=600, y_max=500) 则归一化值为:
x_center = (200 + 600) / (2 * 1000) = 0.4
y_center = (300 + 500) / (2 * 800)   = 0.5
width    = (600 - 200) / 1000        = 0.4
height   = (500 - 300) / 800         = 0.25
1
2
3
4

对应标注行:0 0.4 0.5 0.4 0.25


# 配置文件 data.yaml

train: ../dataset/images/train/  # 训练集路径
val:   ../dataset/images/val/    # 验证集路径
test:  ../dataset/images/test/   # 测试集路径(可选)

nc: 80                           # 类别总数(number of classes)
names: ['person', 'bicycle', ...] # 类别名称列表
1
2
3
4
5
6

# 关键注意事项

  1. 文件名对应 images/train/img1.jpg 的标注文件必须为 labels/train/img1.txt,名称严格一致。
  2. 数据划分比例 建议:训练集70-80%、验证集10-20%、测试集10-20%。
  3. 类别索引映射 需提供 classes.txt 或直接在 data.yaml 中定义类别名称与索引的映射关系。

# 标注工具推荐

  • LabelImg(支持YOLO格式导出)
编辑 (opens new window)
#AI#CV#Python
上次更新: 2025/06/07, 21:53:36
数据集制作-图像分类
数据集制作-LabelImg的使用

← 数据集制作-图像分类 数据集制作-LabelImg的使用→

最近更新
01
ESP32-网络摄像头方案
06-14
02
ESP32-PWM驱动SG90舵机
06-14
03
ESP32-实时操作系统freertos
06-14
更多文章>
Theme by Vdoing | Copyright © 2019-2025 DC Wang All right reserved | 辽公网安备 21021102001125号 | 吉ICP备20001966号-2
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式