当前位置: 首页 > web >正文

“Datawhale AI夏令营”「结构化数据的用户意图理解和知识问答挑战赛」1

前言:本篇文章是Datawhale AI夏令营2025年第2期的内容,大模型技术方向,科大讯飞「结构化数据的用户意图理解和知识问答挑战赛」的赛事项目实践。

  1. 理解用AI理解列车信息表,究竟有哪些难点和价值
  2. 具体要如何判断AI是否真的理解了列车信息表
  3. 基于列车信息表,使用大模型构建QA对

一、本次赛事目标:让大模型理解表格数据(列车信息表)

知识点提要表结构数据处理、微调数据集构造、模型蒸馏

相关知识点清单:

学习模块

核心知识点

一句话介绍

大语言模型基础

大模型 API 调用方法

学习如何通过 API 使用大语言模型,发送请求并获取结果。

Prompt 工程

掌握如何编写有效的提示词,引导模型输出期望的结果。

参数高效微调

LoRA 和合并精调的区别

了解 LoRA(低秩适配)与合并精调在模型微调中的不同原理和使用场景。

全量微调

对整个模型的所有参数进行训练,以适应特定任务或数据集。

数据集构建

pandas 的基本使用

学习使用 pandas 进行数据读写、整理和基础操作。

pandas 的数据筛选

掌握 pandas 中按条件筛选和提取数据的方法,如 loc、iloc 和布尔索引等。

赛事背景

在智慧交通平台中,乘客和调度人员需快速从庞杂的列车时刻表中获取精准信息(如检票口位置、停留时间、跨车次关联)。

传统方法依赖人工查询和分析,效率低且难以应对复杂问题。

大模型在表格理解方面已经取得了显著的进展,正在帮助用户以更直观、更高效的方式处理和解释数据。

本次赛事聚焦 铁路运输场景 ,基于真实列车时刻表数据,要求参赛者 构建能够理解表格语义、处理时间计算、跨字段推理的大模型 问答系统 ,提升信息查询自动化水平。

赛题解读

本次大赛提供了结构化数据表格(列车时刻表)作为数据集,参赛者需基于讯飞星辰MaaS平台构建一个人工智能模型。

该模型能基于给定表格中的结构化数据,结合表格内容提取信息并回答指定的问题。

赛事任务分为两个阶段:

  1. 让模型学习如何解析和表示表格数据。【生成可用于微调的QA对】

  2. 回答与表格数据对应的自然语言问题。【微调,让大模型掌握这个表格的知识并进行回答】

该模型应具备自然语言处理(NLP)能力,能够理解用户自然语言问题中的意图(如查询始发站、终到站、检票口等),以支持多种问题类型,例如:

七类问题

 赛题要点与难点

核心要点

  1. 数据预处理:时间格式标准化、缺失值处理、数据质量提升是基础。

  2. 模型选择与微调:必须支持LoRA精调,且避免使用LoRA合并精调或全量精调(可能产生额外费用)。需要平衡模型大小与性能。

  3. 评估指标优化

    • 答案准确率(AS):40%权重

    • 回答响应时长(ART):30%权重

    • 回答信息传达效率(AE):30%权重

    • 注意:响应时长和信息传达效率的得分以答案准确率为前提,若答案错误,则单条得分直接为零。

    • 由于评分指标中有30%关于模型的速度,采用更大参数量或者深度思考的模型可能会导致ART分值变低。

主要难点

  1. 复杂问题的处理

    • 多条件组合查询(如同时筛选候车厅和发车时间)。

    • 跨行数据计算(如计算不同列车运行时间并比较)。

    • 时间计算与推理(如停留时长、延误后新开点时间)。

  2. 性能优化:在保证准确率的同时,如何提升模型的响应速度和答案生成效率,找到准确率与速度之间的最佳平衡点。

  3. 数据构建挑战:由于平台限制,需要自行构建高质量、多样化的微调数据集来教会模型理解复杂的表格语义和进行推理。

http://www.xdnf.cn/news/16492.html

相关文章:

  • 最优估计准则与方法(5)加权最小二乘估计(WLS)_学习笔记
  • 【图像分割】记录1:unet, yolov8_seg
  • 基于springboot的在线数码商城/在线电子产品商品销售系统的设计与实现
  • 如何解决pip安装报错ModuleNotFoundError: No module named ‘ipython’问题
  • 【iOS】网易云仿写
  • 【守护】同为科技SPD:AP-20D/4P产品解析
  • 【leetGPU】1. Vector Addition
  • 其他世界的自来水
  • 统计与大数据分析与数学金融课程解析
  • ThreadLocal--ThreadLocal介绍
  • 技术 — 资本双螺旋:AI 时代的投资浪潮与技术突破
  • vulhub-earth靶机攻略
  • Mixture-of-Recursions: 混合递归模型,通过学习动态递归深度,以实现对自适应Token级计算的有效适配
  • 什么是缓存雪崩?缓存击穿?缓存穿透?分别如何解决?什么是缓存预热?
  • QT中启用VIM后粘贴复制快捷键失效
  • SQL Developer Data Modeler:一款免费跨平台的数据库建模工具
  • Linux c++ CMake常用操作
  • 数字迷雾中的安全锚点:解码匿名化与假名化的法律边界与商业价值
  • 融合为体,AI为用:数据库在智能时代的破局之道
  • petalinux配置总结
  • 卫星通信终端天线对星之:参考星对星
  • SSE (Server-Sent Events) 服务出现连接卡在 pending 状态的原因
  • 数据库HB OB mysql ck startrocks, ES存储特点,以及应用场景
  • 树上倍增和LCA问题
  • 【Zephyr】Window下的Zephyr编译和使用
  • 数学建模国赛历年赛题与优秀论文学习思路
  • 考研复习-数据结构-第八章-排序
  • 洛谷 P1217:[USACO1.5] 回文质数 Prime Palindromes
  • Android开发中线上crash问题解决流程
  • [spring6: Mvc-函数式编程]-源码解析