复制与图片文件同名的标签文件到目标路径
引言:在数据集构建中,我们经常需要挑选一些特殊类型的图片(如:零件中有特殊脏污背景的图片,写论文的时候想单独对这类情况进行热力图验证)。我们把挑选出来的图片放到一个文件夹下,这时候我想快速得到挑出图片对应的标签,如果一个一个在原来的大文件夹中寻找同名标签非常麻烦,这时候就可以使用以下脚本:
代码实现
import os
import shutildef copy_matching_labels(img_dir, label_dir, target_dir):"""复制与图片文件同名的标签文件到目标路径参数:img_dir: 图片文件夹路径label_dir: 原始标签文件夹路径target_dir: 目标文件夹路径"""# 支持的图片扩展名image_extensions = ['.jpg', '.jpeg', '.png', '.bmp', '.tiff', '.webp']# 确保目标目录存在os.makedirs(target_dir, exist_ok=True)# 获取图片文件列表(不含扩展名)image_files = []for file in os.listdir(img_dir):file_base, ext = os.path.splitext(file)if ext.lower() in image_extensions:image_files.append(file_base)# 复制匹配的标签文件copied_count = 0for label_file in os.listdir(label_dir):if label_file.endswith('.txt'):label_base = os.path.splitext(label_file)[0]if label_base in image_files:src_path = os.path.join(label_dir, label_file)dst_path = os.path.join(target_dir, label_file)shutil.copy2(src_path, dst_path)copied_count += 1print(f"已复制: {label_file}")print(f"\n操作完成! 共复制 {copied_count} 个标签文件")print(f"图片文件数量: {len(image_files)}")print(f"目标目录: {os.path.abspath(target_dir)}")if __name__ == "__main__":img = "C:/Users/admin/Desktop/新建文件夹" # 选出来的图片文件夹labels = "E:/数据集/labels/val" # 原数据集的标签文件夹target = "C:/Users/admin/Desktop/新建文件夹 (2)" # 新的标签文件夹copy_matching_labels(img_dir=img,label_dir=labels,target_dir=target)