当前位置: 首页 > ops >正文

.NET GcPDF V8.2 新版本:人工智能 PDF 处理

一、GcPDF 产品简介

GcPDF(GrapeCity Documents for PDF)是葡萄城(GrapeCity)推出的一款功能强大的 .NET PDF 开发组件,旨在为开发人员提供高效、灵活的 PDF 文档处理解决方案。无论是创建全新 PDF 文档、编辑现有 PDF 内容,还是进行 PDF 转换、批注、签名、表单处理等操作,GcPDF 均能通过简洁易用的 API 实现,广泛适用于企业级报表生成、文档管理系统、电子合同签署、金融票据处理等各类业务场景。

作为 .NET 生态下的成熟 PDF 组件,GcPDF 具备跨平台特性,支持 .NET Framework、.NET Core、.NET 5+ 及以上版本,可在 Windows、Linux、macOS 等操作系统中稳定运行,同时兼顾高性能与低内存占用,能轻松应对大规模 PDF 文档的批量处理需求,帮助开发团队快速构建专业的 PDF 相关应用。

二、GcPDF V8.2 新特性:AI 驱动的 PDF 处理

V8.2 版本新增了功能强大的软件包 GcPDF AI ,该软件包旨在展示 GcPDF 如何与 AI 服务集成,进而优化 PDF 文档工作流程。借助此特性,开发人员可利用 OpenAI 或 Azure OpenAI 直接从 PDF 中生成摘要、创建大纲树,并提取结构化表格数据。

支持的场景

目前,GcPDFAI 支持以下三种由 AI 驱动的 PDF 处理功能:

  • 生成文档摘要 - 快速生成任意 PDF 文档的简短或详细摘要。

  • 可在 C# 或 VB 语言中通过编程方式,利用 GcPDFAI 生成 PDF 文档摘要。

  • 构建文档大纲树 - 自动生成结构化目录,并包含嵌套大纲层级。

  • 借助 .NET PDF API 中集成的 AI 功能,自动生成结构化目录。

  • 从文档中提取表格 - 通过自然语言提示,从 PDF 中识别并提取表格数据。

  • 利用 PDF API 的 AI 功能从 PDF 中提取表格。

上述功能均基于 OpenAI Chat API 构建,支持通过两种方式连接:一是通过官方 OpenAI .NET 客户端库,二是通过 Azure OpenAI 服务。

API 概述

该新软件包包含两个主要类,二者均继承自同一个用于实现核心功能的基类:

  • OpenAIDocumentAssistant:通过官方 .NET 客户端库连接至 OpenAI REST API。
  • AzureOpenAIDocumentAssistant:通过 Azure.AI.OpenAI 软件包连接至 Azure OpenAI 服务。

这两个类均派生自 OpenAIDocumentAssistantBase 基类,该基类实现了两项关键逻辑:一是通过 Page.GetText() 方法提取文本,二是将内容发送至 AI 服务进行处理。其中,pageRange 参数允许开发人员将请求范围限定在 PDF 的特定章节。

以下代码示例展示了如何在 GcPDF 中实现人工智能驱动的功能:

支持的平台

  • OpenAI REST API(通过官方 .NET 客户端连接)
  • Azure OpenAI 服务(通过 Azure.AI.OpenAI 软件包连接)
http://www.xdnf.cn/news/19902.html

相关文章:

  • Spring Boot 根据配置优雅的决定实现类
  • Meshroom 2025.1.0安装及使用参数模板介绍:二维图片转三维重建
  • 因为对象装箱拆箱导致的空指针异常
  • C#强制类型转换(显示转换)和安全类型转换
  • 野火STM32Modbus主机读取寄存器/线圈失败(三)-尝试将存贮事件的地方改成数组(非必要解决方案)(附源码)
  • VBA中类的解读及应用第二十七讲:利用类完成查找的方案-5
  • SVT-AV1 svt_aom_motion_estimation_kernel 函数分析
  • 详细学习计划
  • 百度前端社招面经
  • 云手机运行是否消耗自身流量?
  • Docker(④Shell脚本)
  • 【RNN-LSTM-GRU】第五篇 序列模型实战指南:从选型到优化与前沿探索
  • 应对反爬:使用Selenium模拟浏览器抓取12306动态旅游产品
  • 40,.Ansible角色(roles)
  • 具身智能多模态感知与场景理解:视觉探索
  • 如何本地编译servicecomb-java-chassis
  • Focal Loss
  • Elasticsearch 8 中 Nested 数据类型的使用方法
  • 【文献解读】ceRNA机制研究经典思路
  • Spring Boot项目中MySQL索引失效的常见场景与解决方案
  • 从群体偏好到解构对齐:大模型强化学习从GRPO到DAPO的“认知”进化
  • 【高并发内存池】四、中心缓存的设计
  • 疯狂星期四文案网第60天运营日记
  • GEO排名优化效益分析:为何AI搜索优化服务是当下性价比最高的流量投资?
  • 学习资料1(粗略版)
  • Web详解
  • WebSocket简述与网络知识回顾
  • Ubuntu镜像源配置
  • Kafka如何保证高可用
  • EasyExcel:阿里开源的高效 Excel 处理工具,轻松解决 POI 内存溢出问题