当前位置: 首页 > java >正文

brep2seq 论文笔记

Brep2Seq: a dataset and hierarchical deep learning network for reconstruction and generation of computer-aided design models | Journal of Computational Design and Engineering | Oxford Academic

 

 

 

 

 

这段文本描述了一个多头自注意力机制(MultiHead Attention)的实现细节,该机制是Transformer架构中的核心组件之一。以下是公式(14)和(15)及其相关概念的详细解释:

公式(14)解析
MultiHead (H): 多头自注意力机制的输出。

Concat(head_1, ..., head_M): 将M个独立的自注意力头(heads)的输出进行拼接(concatenation)。每个自注意力头都会生成一个单独的特征表示,通过拼接这些表示,可以得到一个更丰富的综合特征。
W^O: 一个线性变换矩阵,用于将拼接后的特征向量映射到最终的输出维度。
公式(15)解析
1. head_m = self-att(H, A_1, A_2, A_3):
这部分定义了第m个自注意力头的计算过程,它依赖于输入隐藏状态H以及三个额外的矩阵A_1、A_2和A_3,这些矩阵可能包含了关于节点间关系的特定信息。
2. softmax(...):
计算注意力分数的过程使用了softmax函数,以确保所有注意力分数加起来等于1,从而形成一个有效的概率分布。
注意力分数由以下几部分组成:
Q_mK_m^T / √d_k: 这是标准的自注意力机制中的点积注意力(Dot-product attention),其中Q_m和K_m分别是查询(Query)和键(Key)矩阵,d_k是它们的维度。这个部分用于衡量不同位置之间的相似度。
A_1(W_a1^m)^T + A_2(W_a2^m)^T + A_3(W_a3^m)^T: 这些项引入了额外的偏置或权重,它们与A_1、A_2和A_3矩阵相乘,并与查询和键的点积结果相加。这可能是为了融入图结构或其他先验知识到注意力机制中。
3. V_m:
V_m是值(Value)矩阵,它与注意力分数相乘,以生成最终的输出特征向量。
4. Q_m, K_m, V_m 的计算:
对于每一个自注意力头m,查询Q_m、键K_m和值V_m都是通过输入隐藏状态H与相应的权重矩阵W_q^m、W_k^m和W_v^m相乘得到的。
总结
每个自注意力头独立地计算注意力分数和输出特征,然后将这些特征拼接在一起并通过一个线性变换层得到最终的多头自注意力输出。
通过引入额外的矩阵A_1、A_2和A_3,该机制能够更好地捕捉和利用输入数据中的结构化信息,如图结构中的边和面的关系。
这种设计使得模型能够在处理复杂的数据结构时,更加灵活和高效地提取和整合信息。

等等研究这篇3D CAD model retrieval based on sketch and unsupervised variational autoencoder - ScienceDirect

http://www.xdnf.cn/news/9226.html

相关文章:

  • 《软件工程》第 16 章 - 软件项目管理与过程改进
  • C-字符串函数
  • 解析极限编程-拥抱变化(第2版)笔记
  • 【C/C++】多线程下自旋锁的行为逻辑
  • C语言创意编程:用趣味实例玩转基础语法(2)
  • ES 在大查询场景下导致 GC 频繁,如何定位和解决?
  • webstorm调试vite工程(后端开发人员版)
  • 从十进制到二进制:深入理解定点数与浮点数表示
  • 高压单端探头,如何实现大比例的衰减?
  • 【NLP基础知识系列课程-Tokenizer的前世今生第二课】NLP 中的 Tokenizer 技术发展史
  • 【Vue3】生命周期 hook函数 toRef
  • 通义智文开源QwenLong-L1: 迈向长上下文大推理模型的强化学习
  • 浅解Vue 数据可视化开发建议与速度优化
  • 【华为云物联网】如何实现在 MQTT.fx 上模拟数据间隔上传一次,并按设定系数变动数据
  • HTML 表单与输入:基础语法到核心应用全解析
  • UBUNTU20.04 配置以QT界面程序代替系统界面启动,以及如何在tty模式下以linuxfb形式启动
  • Halcon 霍夫变换
  • 获取页面上当前激活(获得焦点)的元素
  • Frequent values/gcd区间
  • 行为型:中介者模式
  • C++11 中引入的`final` 关键字作用。
  • ImageMagick 是默认使用 CPU 来处理图像,也具备利用 GPU 加速的潜力
  • 数据库的事务(Transaction)
  • 路桥隧养护决策系统
  • atomic.Value 中存储的数据是否会被 GC
  • vue展示修改前后对比,并显示修改标注diff
  • 四足机器人环境监测系统相关问题
  • Mac 每日磁盘写入量异常高
  • AI如何颠覆财务预测?——用Python打造自动化智能分析系统
  • 基于Java,SpringBoot,Vue,UniAPP宠物洗护医疗喂养预约服务商城小程序管理系统设计