当前位置: 首页 > ds >正文

图像描述编辑器 (Image Caption Editor)

YujunCui/ImageCaptionEditor: A graphical interface tool for editing image-text pair data, supporting two data formats: image_json_pair format and message format.https://github.com/YujunCui/ImageCaptionEditor一个用于编辑图像-文本对数据的图形界面工具,支持两种数据格式:image_json_pair格式和message格式。

如果有帮助到大家,请多多点赞!

功能特点

  • 支持两种数据格式:

    • image_json_pair格式:每个图像文件对应一个同名的JSON文件,JSON文件中包含图像描述信息

    • message格式:一个JSON文件包含多个图像描述条目,每个条目可以引用多个图像文件

  • 多语言界面支持(中文/英文)

  • 图像预览功能,支持缩放

  • 文本编辑区域,支持JSON格式的描述编辑

  • 导航功能:支持前后浏览、跳转到指定图像

  • 键盘快捷键支持,提高操作效率

界面介绍

主要组件

  1. 左侧控制面板

    • 语言选择:支持中英文界面切换

    • 模式选择:选择数据格式(image_json_pair或message)

    • 目录设置:选择包含数据的目录

    • 图像导航:前后浏览图像,跳转到指定图像

    • 文本编辑:进入编辑模式

    • 信息显示:显示图像总数等信息

  2. 右侧显示区域

    • 图像预览区域:显示当前图像,支持缩放

    • 文本编辑区域:显示和编辑图像描述的JSON数据

使用方法

数据格式说明

image_json_pair格式

该格式要求每个图像文件都有一个对应的同名JSON文件,例如:

data/
├── image1.jpg
├── image1.json
├── image2.png
└── image2.json

其中JSON文件内容格式如下:

[{"vision_path": "D:\\Data\\mllm_testdata\\test_imgs\\有肢体冲突\\0.jpg","answer": "一对情侣在户外,互相嬉闹,背景有树木和蓝天。"}
]
message格式

该格式使用一个JSON文件包含所有图像描述信息:

[{"messages": [{"content": "<image>请简短描述图片内容。","role": "user"},{"content": "一对情侣在户外互相嬉闹,背景有树木和蓝天。","role": "assistant"}],"images": ["D:\\Data\\mllm_testdata\\test_imgs\\有肢体冲突\\0.jpg"]},{"messages": [{"content": "<image>请简短描述图片内容。","role": "user"},{"content": "四人围成一圈,用竹竿互相推搡。","role": "assistant"}],"images": ["D:\\Data\\mllm_testdata\\test_imgs\\有肢体冲突\\71a046b26d52218a15be3fecc938f246.jpeg"]}
]

操作指南

  1. 选择数据目录

    • 点击"选择目录"按钮,选择包含图像和JSON文件的目录

  2. 浏览图像

    • 使用"第一张"、"上一张"、"下一张"、"最后一张"按钮导航

    • 使用键盘快捷键:Home(第一张)、End(最后一张)、F(下一张)、D(上一张)

    • 在跳转输入框中输入序号直接跳转到指定图像

  3. 查看图像

    • 图像会自动显示在左侧预览区域

    • 使用鼠标滚轮上下滚动查看多张图像

    • 使用Ctrl+鼠标滚轮进行图像缩放,但是图像会被限制在图像预览区域

  4. 编辑描述

    • 点击"编辑文本"按钮或按E键进入编辑模式

    • 在文本编辑区域修改JSON格式的描述内容

    • 按Ctrl+S保存修改,或按Esc取消编辑

    • 点击"保存修改"按钮确认保存,或点击"退出编辑"按钮放弃修改

  5. 界面语言切换

    • 在"Language / 语言"选项中选择English或中文

快捷键列表

快捷键功能
Ctrl+S保存修改
Ctrl+Z撤销
Ctrl+Y重做
Esc退出编辑模式
E进入编辑模式
F下一张图像
D上一张图像
Home第一张图像
End最后一张图像
Ctrl+鼠标滚轮图像缩放
Ctrl+0重置图像缩放

注意事项

  1. 确保JSON文件格式正确,否则可能导致程序出错

  2. 图像文件和JSON文件需要正确对应

  3. 在message格式中,图像路径可以是绝对路径或相对于JSON文件的相对路径

  4. 编辑时请保持JSON格式的正确性,否则无法保存

  5. 程序会自动保存每张图片的缩放状态,方便再次查看时保持相同的缩放比例

  6. 程序在处理大量数据时可能会卡顿,请分批处理

http://www.xdnf.cn/news/19510.html

相关文章:

  • 极客时间AI 全栈开发实战营毕业总结(2025年8月31日)
  • 【Linux基础】深入理解计算机存储:GPT分区表详解
  • 前端组件拆分与管理实战:如何避免 props 地狱,写出高可维护的项目
  • 《Unity Shader入门精要》学习笔记四(高级纹理)
  • ing Data JPA 派生方法 数据操作速查表
  • 【WEB】[BUUCTF] <GXYCTF2019禁止套娃>《php函数的运用》
  • ADC platfrom day65
  • MVC架构模式
  • Blender建模:对于模型布线的一些思考
  • 介绍GSPO:一种革命性的语言模型强化学习算法
  • 现代C++性能陷阱:std::function的成本、异常处理的真实开销
  • Luma 视频生成 API 对接说明
  • AI 智能体汇总,自动执行任务的“真 Agent”
  • 查看所有装在c盘软件的方法
  • Trae接入自有Deepseek模型,不再排队等待
  • OpenStack 03:创建实例
  • 并发编程——11 并发容器(Map、List、Set)实战及其原理分析
  • Opencv的数据结构
  • wifi控制舵机
  • AI热点周报(8.24~8.30):Grok 2.5开源,OpenAI Realtime正式商用,Meta或与OpenAI或Google合作?
  • 从零开始的python学习——语句
  • python pyqt5开发DoIP上位机【自动化测试的逻辑是怎么实现的?】
  • lumerical_FDTD_光源_TFSF
  • 《中国棒垒球》垒球世界纪录多少米·垒球8号位
  • 第2.3节:AI大模型之Claude系列(Anthropic)
  • [特殊字符]️ STL 容器快速参考手册
  • LangChain实战(五):Document Loaders - 从多源加载数据
  • Python库2——Matplotlib2
  • JAVA EE初阶 4:文件操作和IO
  • PCIe 6.0 vs 5.0:带宽翻倍背后的技术革新与应用前景