当前位置: 首页 > news >正文

蚂蚁数科AI数据产业基地正式投产,携手苏州推进AI产业落地

近日,蚂蚁数科AI数据产业基地在太仓智汇谷·科技创新园正式投产。该基地作为苏州市首个AI数据产业基地,旨在通过跨行业人才与前沿技术,为长三角制造业、金融、医疗等领域的大模型落地提供场景化、高质量的训练数据支撑。

数据被视为AI学习的核心教材。然而,AI在工业等复杂场景落地时,常面临行业知识匮乏、高质量数据稀缺等瓶颈,急需专业人才参与建设。专业的AI数据标注师,被誉为“AI教官”,他们通过精确标注和修正,确保训练数据准确、无偏见,以此提升模型输出的安全性与可靠性,并持续“教导”AI理解语义、更通人情。

赵秋燕是某财经大学金融学本科毕业,曾从事会计工作,擅长纠正AI回答的金融问题。学法律的严冯娜,主要工作是标注大模型输出文字中涉及的“红线”问题,教AI“什么能说,什么不能说”。标注师李宁曾经是个美术老师,他需要面对大量图片数据,标注其中的“内容风险”。医学、外语、旅游等领域的专业人才也正加入各垂类模型的数据标注工作。

“蚂蚁数科AI标注师队伍的平均学历在本科以上,太仓政府在园区建设、人才招募、生态企业入驻等方面提供了强力支持。”蚂蚁数科AI科技事业部总经理张凯介绍,蚂蚁数科已与江苏多所高校开展产教融合、孵化AI实战人才。按计划,基地未来将扩展至300人规模。

技术层面,蚂蚁数科自研的AI数据标注平台可智能推荐标注内容、自动补全标签,结合自动化质检与人工抽检双重保障数据质量。当前其标注服务已覆盖金融风控、内容审核、自动驾驶、智能客服等数十个场景,为多领域大模型产业化提供可靠的数据基石。

http://www.xdnf.cn/news/1164817.html

相关文章:

  • 奥比中光深度相机开发
  • 感知机-梯度下降法
  • 141 个 LangChain4j Maven 组件分类解析、多场景实战攻略
  • 一个月掌握数据结构与算法:高效学习计划
  • hot100回归复习(算法总结1-38)
  • 零拷贝技术(Zero-Copy)
  • 网络协议(四)网络层 路由协议
  • C++基于libmodbus库实现modbus TCP/RTU通信
  • 大模型——上下文工程 (Context Engineering) – 现代 AI 系统的架构基础
  • C# 实现:动态规划解决 0/1 背包问题
  • iOS开发 Swift 速记2:三种集合类型 Array Set Dictionary
  • OCR 身份识别:让身份信息录入场景更高效安全
  • 如何使用终端查看任意Ubuntu的版本信息
  • 用 Three.js 实现 PlayCanvas 风格 PBR 材质教程(第二篇):核心参数与光照模型
  • DBSCAN聚类算法
  • OpenAI Codex CLI与 Google Gemini CLI 比较
  • 关于java8里边Collectors.toMap()的空限制
  • 泛型:C#中的类型抽象艺术
  • Android NDK ffmpeg 音视频开发实战
  • 数据结构 之 【排序】(直接插入排序、希尔排序)
  • 【C++】list的模拟实现
  • 音视频学习(四十二):H264帧间压缩技术
  • 周志华《机器学习导论》第13章 半监督学习
  • [深度学习] 大模型学习3上-模型训练与微调
  • 机器学习初学者理论初解
  • MySQL:表的增删查改
  • 基于VSCode的nRF52840开发环境搭建
  • C++高性能日志库spdlog介绍
  • 如何解决pip安装报错ModuleNotFoundError: No module named ‘pywifi’问题
  • boost::asio 中 io_service与线程的关系