当前位置: 首页 > news >正文

PaddleNLP系列1-基础知识

单塔,query和title进行拼接输入到同一个模型

单塔 Point-wise 范式,不引入负样本

基于单塔 Point-wise 范式的语义匹配模型 ernie_matching: 模型精度高、计算复杂度高, 适合直接进行语义匹配 2 分类的应用场景。

单塔 Pair-wise 范式,引入同一批次的负样本,正例更近,负例更远

基于单塔 Pair-wise 范式的语义匹配模型 ernie_matching: 模型精度高、计算复杂度高, 对文本相似度大小的序关系建模能力更强,适合将相似度特征作为上层排序模块输入特征的应用场景。

双塔,query和title不拼接,分布单独输入到同一个模型

双塔 Point-wise 范式,不引入负样本

基于双塔 Point-wise 范式的语义匹配模型 SimNet 和 Sentence Transformers, 这 2 种方案计算效率更高,适合对延时要求高、根据语义相似度进行粗排的应用场景。
在这里插入图片描述

双塔 Pair-wise 范式,引入同一批次的负样本,正例更近,负例更远

Baseline 46.99 60.84 标准 pair-wise 训练范式,通过随机采样产生负样本
In-batch negatives 51.20(+4.21) 67.24(+6.4) 在 Batch 内同时使用 batch_size 个负样本进行训练
HardestNeg 50.22(+3.23) 65.17(+4.33)
在 Batch 内先挖掘最难负样本,然后进行 pair-wise 训练
在这里插入图片描述

BERT的输出,本身就有归一化

在这里插入图片描述

http://www.xdnf.cn/news/826003.html

相关文章:

  • Java的clientSocket
  • Docker之RUN、COMMAND、ENTRYPOINT辨析
  • Java编程技巧之样板代码
  • 随心听(OnlineMusic)项目 保姆级教程
  • PlayBook 详解
  • SQL语言基础【学习总结】
  • 在Android Studio下进行NDK开发
  • 极狐GitLab 17.1 到底发布了哪些重大功能?
  • 浅谈网络代理 proxy
  • 【物联网】探索NE555:一款经典的集成电路(超详细)
  • JSON 数组
  • 17.Oracle11g的PL/SQL基础
  • 13个程序员常用开发工具用途推荐整理
  • 原码, 反码, 补码 详解
  • 服务器135、137、138、139、445等端口解释和关闭方法
  • LPC特征提取及语音信号处理
  • f12获取网页文本_F12 - 开发者工具详解
  • SWA(随机权重平均) for Pytorch
  • AspectJ详解
  • web-uploader多文件上传问题,预览问题
  • Mysql数据类型最细讲解
  • 利用weka进行数据挖掘——基于Apriori算法的关联规则挖掘实例
  • 矩阵运算规律总结
  • Sortable.js官方文档记录
  • 【浏览器】五大最好用的浏览器 最受欢迎的浏览器软件
  • 一文读懂上拉电阻:工作原理和阻值确定
  • bootstraptable 手册_JS表格组件神器bootstrap table使用指南详解
  • 一文读懂 K8s 持久化存储流程
  • COCOS学习笔记--TexturePacker使用详解
  • Hutool工具包等常用工具类总结