当前位置: 首页 > news >正文

轻量级证件照制作 AI 工具 HivisionIDPhotos 介绍

在这里插入图片描述

介绍

HivisionIDPhotos 是一款基于 AI 技术的开源证件照生成工具,支持智能抠图、背景替换、多尺寸生成等功能,适合个人和企业快速制作标准证件照。

  1. 智能抠图与背景替换

    • 采用深度学习模型(如 MODNet、RetinaFace)实现高精度人像分离,支持纯色背景替换(红、蓝、白等)。
    • 提供多种抠图模型选择,如 rmbg-1.4、birefnet-v1-lite,适应不同场景需求。
  2. 多尺寸证件照生成

    • 支持常见证件照尺寸(1寸、2寸、护照、签证等),并可自定义尺寸。
    • 自动排版为六寸规格,方便批量打印。
  3. 轻量化与高效处理

    • 纯离线运行,仅需 CPU 即可快速推理,无需高性能硬件。
    • 未来将推出美颜、智能换正装等进阶功能。
  4. 目前在 GitHub 上已经收集到 15.7k 星🌟。
    在这里插入图片描述

  5. GitHub:https://github.com/Zeyi-Lin/HivisionIDPhotos

优势与适用场景

  1. 隐私安全:支持纯本地部署,避免照片数据外传。
  2. 灵活扩展:提供 API 接口,可集成至企业系统或第三方应用。
  3. 多场景适用:
    • 个人:居家制作签证、简历照片等。
    • 企业:批量处理员工证件照,或集成到摄影服务中

使用

  1. 环境安装与依赖
  • Python >= 3.7(项目主要测试在 python 3.10)
  • OS: Linux, Windows, MacOS
  1. 克隆项目
git clone https://github.com/Zeyi-Lin/HivisionIDPhotos.git
cd  HivisionIDPhotos
  1. 安装依赖环境
# 建议 conda 创建一个 python3.10 虚拟环境后,执行以下命令
pip install -r requirements.txt
pip install -r requirements-app.txt
  1. 下载人像抠图模型权重文件
python scripts/download_model.py --models all
# 如需指定下载某个模型
# python scripts/download_model.py --models modnet_photographic_portrait_matting

运行 Gradio Demo

运行程序将生成一个本地 Web 页面,在页面中可完成证件照的操作与交互。

python app.py

在这里插入图片描述

Python 推理

  1. 证件照制作:输入 1 张照片,获得 1 张标准证件照和 1 张高清证件照的 4 通道透明 png
python inference.py -i demo/images/test0.jpg -o ./idphoto.png --height 413 --width 295
  1. 人像抠图:输入 1 张照片,获得 1张 4 通道透明 png
python inference.py -t human_matting -i demo/images/test0.jpg -o ./idphoto_matting.png --matting_model hivision_modnet
  1. 透明图增加底色:输入 1 张 4 通道透明 png,获得 1 张增加了底色的 3通道图像
python inference.py -t add_background -i ./idphoto.png -o ./idphoto_ab.jpg  -c 4f83ce -k 30 -r 1
  1. 得到六寸排版照:输入 1 张 3 通道照片,获得 1 张六寸排版照
python inference.py -t generate_layout_photos -i ./idphoto_ab.jpg -o ./idphoto_layout.jpg  --height 413 --width 295 -k 200
  1. 件照裁剪:输入 1 张 4 通道照片(抠图好的图像),获得 1 张标准证件照和 1 张高清证件照的 4 通道透明 png
python inference.py -t idphoto_crop -i ./idphoto_matting.png -o ./idphoto_crop.png --height 413 --width 295

其余方法

  • 部署 API 服务和 Docker 部署请参考原项目说明。
http://www.xdnf.cn/news/341191.html

相关文章:

  • Android 查看 Logcat (可纯手机方式 无需电脑)
  • ZooKeeper工作机制与应用场景
  • 中国自动驾驶研发解决方案,第一!
  • SM2Utils NoSuchMethodError: org.bouncycastle.math.ec.ECFieldElement$Fp.<init
  • 【Electron】electron-vue 借助 element-ui UI 库助力桌面应用开发
  • 维吉尼亚密码C++实现
  • 责任链设计模式
  • 路由器断流排查终极指南:从Ping测试到Wireshark抓包5步定位法
  • Windows Server 2025 安装AMD显卡驱动
  • android.app.Fragment和androidx.fragment:fragment的区别
  • ActiveMQ 源码剖析:消息存储与通信协议实现(四)
  • 预训练模型实战手册:用BERT/GPT-2微调实现10倍效率提升,Hugging Face生态下的迁移学习全链路实践
  • 数据中台-数仓分层结构【Doris】
  • 【LunarVim】CMake LSP配置
  • 基于Kubernetes的Apache Pulsar云原生架构解析与集群部署指南(上)
  • python 上海新闻爬虫
  • Baumer工业相机堡盟工业相机的工业视觉中为什么偏爱“黑白相机”
  • 【前端基础】8、CSS的选择器
  • HTML10:iframe内联框架
  • AI时代企业应用系统架构的新思路与CIO变革指南
  • 如何使用极狐GitLab 软件包仓库功能托管 helm chart?
  • 【RAG技术全景解读】从原理到工业级应用实践
  • Redis 8.0正式发布,再次开源为哪般?
  • 基于STM32、HAL库的CP2102-GMR USB转UART收发器 驱动程序设计
  • keep the pipe Just full But no fuller - BBR 与尘封 40 年的求索
  • ETL介绍及kettle等工具学习
  • 科学发现 | 源于生活的启示与突破计划的创新
  • android-ndk开发(9): undefined reference to `__aarch64_ldadd4_acq_rel` 报错分析
  • [数据库之十一] 数据库索引之联合索引
  • 大模型调优方法与注意事项