当前位置: 首页 > news >正文

知识图谱的初步探索

目录

一、有监督、半监督、无监督

二、知识图谱

1、定义

2、分类

3、如何构建?

数据来源

构建步骤

4、应用场景

(1)智能搜索与推荐

(2)智能问答系统(QA)

(3)辅助医疗与金融分析

(4)人工智能模型的知识增强(KGC、K-BERT)

参考链接:


一、有监督、半监督、无监督

        有监督:训练数据是带有标签的【图像分类(猫 vs 狗)、垃圾邮件识别(是否为垃圾邮件)】

        半监督:训练数据中只有一部分是带标签的,剩下的大量数据是无标签的。用少量标注数据+大量未标注数据进行训练,提高泛化能力。

        无监督:训练数据完全没有标签,模型从中自行发现结构或规律。【用户画像分析、市场细分(将客户聚类)、商品推荐系统中的相似商品识别】

二、知识图谱

1、定义

        识图谱是一种结构化表示知识的方式。它以“实体-关系-实体”的三元组形式,构建出一个模拟现实世界的语义网络

用图结构(节点+关系)组织知识,其中:

  • **节点(实体)**表示“知识点”

  • **边(关系)**表示“知识点之间的逻辑联系”

2、分类

类型说明例子
通用知识图谱包含多个领域、面向开放世界的知识百度知识图谱、Wikidata、Freebase
垂直领域知识图谱聚焦某一专业领域,知识更精细、更准确医疗知识图谱、法律知识图谱、金融知识图谱

3、如何构建?

数据来源

  • 文本(百科、新闻、论文等)

  • 数据库(维基百科、Freebase、医疗数据库等)

  • 人工标注或众包

构建步骤

(1)信息抽取

  • 实体识别(NER)

  • 关系抽取(Relation Extraction)

  • 属性抽取(Attribute Extraction)

(2)知识融合

  • 消歧:识别“Apple(公司)” vs “Apple(水果)”

  • 合并:整合多个数据源中重复或近似的信息

(3)知识表示

  • RDF图结构

  • 向量表示(用于下游AI模型)

(4)知识补全(可选):

  • 利用图神经网络、嵌入模型自动补全缺失知识

4、应用场景

(1)智能搜索与推荐

搜索引擎中的“知识卡片”、人物关系图谱、基于兴趣的推荐系统,背后都离不开知识图谱的支持。

(2)智能问答系统(QA)

让机器真正“理解”你的问题,并给出语义层面的答案。

例:
用户问:“爱因斯坦是哪国人?”
系统查询知识图谱中“(爱因斯坦, 国籍, 德国)”,直接返回“德国”。

(3)辅助医疗与金融分析

医疗图谱帮助诊断和药物推荐,金融图谱用于反洗钱、关联公司分析、舆情监测等。

(4)人工智能模型的知识增强(KGC、K-BERT)

知识图谱提供“常识”与“世界知识”,补足大模型的短期记忆能力。

参考链接:

知识图谱入门——认识知识图谱 - 知乎

1. 通俗易懂解释知识图谱(Knowledge Graph) - hyc339408769 - 博客园

http://www.xdnf.cn/news/1194319.html

相关文章:

  • 智慧农业病虫害识别准确率↑32%:陌讯多模态融合算法实战解析
  • 特产|基于SSM+vue的南阳特产销售平台(源码+数据库+文档)
  • LLM中 词嵌入向量中的正负值表示什么含义
  • GO 从入门到精通
  • python---元组解包(Tuple Unpacking)
  • VisionPro系列讲解 - 03 Simulator 模拟器使用
  • 【RHCSA 问答题】第 13 章 访问 Linux 文件系统
  • Windows Server存储池,虚拟磁盘在系统启动后不自动连接需要手动连接
  • 【js】Function.prototype.apply与Function.prototype.apply.call
  • 学习日志19 python
  • 电子电气架构 --- 高阶智能驾驶对E/E架构的新要求
  • 1.安装anaconda详细步骤(含安装截图)
  • Rust赋能土木工程数字化
  • Go的管道——channel
  • 大话数据结构之 < 栈>(C语言)
  • InfluxDB Flux 查询协议实战应用(二)
  • Voxtral Mini:语音转文本工具,支持超长音频,多国语音
  • 机器学习对中特估股票关键特征选取的应用与研究
  • pose调研
  • Ubuntu 18.04安装Fast-Lio2教程
  • 第10篇:实战验收篇
  • 【HTML】<script>元素中的 defer 和 async 属性详解
  • Flutter 提取图像主色调 ColorScheme.fromImageProvider
  • 摘录-打造第二大脑
  • Chessboard and Queens
  • 磁悬浮轴承(AMB)系统中引入转速频率陷波器失稳分析
  • MySQL 中 VARCHAR(50) 和 VARCHAR(500) 的区别
  • docker 从主机复制文件到容器外进行编辑
  • Pspice仿真电路:(三十四)如何使用Pspcie进行仿真
  • 定义域第一题