当前位置：首页 > news >正文

NNLM神经网络语言模型总结

news 2025/8/29 15:17:36

一开始还以为很复杂，总结一下就是：

NNLM 将某个单词前 n−1 个词各自转为 embedding，拼接成一个 (n−1)⋅d 维的向量，再通过隐藏层 + 输出层 + softmax，预测下一个词的概率分布

可以发现，这个2003年提出的模型在架构上和GPT大体是没区别的，都是用之前的文字预测下一个文字；都是用之前文字的embedding经过一个特殊层（前者是FFN，后者是transformer decoder）来得到一个词表向量，根据向量的分量大小选择某个单词。

后话

当然，前者的效果差多啦，也存在不能辨别n-1个token顺序等问题。但是，还是感觉挺神奇的。

http://www.xdnf.cn/news/441685.html

相关文章：

react中安装依赖时的问题【集合】

Android Studio Meerkat与Gradle构建工具升级实战指南

2025年中国主流DevOps平台对比分析：Gitee、阿里云效与GitLab CE的技术适配与合规实践全景解读

excel使用笔记

Qt笔记---》.pro中配置

【IDEA】注释配置

西门子WinCC Unified PC的GraphQL使用手册

常见排序算法及其java实现

《Python星球日记》第69天：生成式模型（GPT 系列）

JVM学习专题（二）内存模型深度剖析

STMCubeMX使用TB6612驱动编码轮并进行测速

微信开发者工具里面模拟操作返回、录屏、网络速度、截屏等操作

94. 二叉树的中序遍历详解：迭代法核心逻辑与出入栈模拟

关于数据湖和数据仓的一些概念

深入解析JVM字节码解释器执行流程（OpenJDK 17源码实现）

44、私有程序集与共享程序集有什么区别？

工具学习_模糊测试

中天互联在数据采集方面有哪些优势？

初探 Skynet：轻量级分布式游戏服务器框架实战

二叉树——层序遍历

MCU程序加密保护（二）ID 验证法加密与解密

SCDN如何有效防护网站免受CC攻击？——安全加速网络的实战解析

深度强化学习 | 图文详细推导软性演员-评论家SAC算法原理

FPGA： Xilinx Kintex 7实现PCIe接口

数据库基础复习笔记

量子计算实用化突破：从云端平台到国际竞合，开启算力革命新纪元

40：相机与镜头选型

虚幻引擎5-Unreal Engine笔记之Qt与UE中的Meta和Property

云图库和黑马点评的项目学习经验

[原创](现代Delphi 12指南):[macOS 64bit App开发]: 获取macOS App的Bundle路径信息.