当前位置: 首页 > web >正文

神经网络与Transformer详解

1. 一个模型的典型场景

对用户咨询的法律问题做自动归类:

婚姻纠纷、劳动纠纷、合同纠纷、债权债务、房产纠纷、交通事故、医疗纠纷、版权纠纷

在这里插入图片描述

2. 模型就是一个数学公式

我们一般将这样的问题描述为:给定一组输入数据,经过一系列数学公式计算后,输出n个概率,分别代表该用户对话属于某分类的概率
举个非常简单的例子:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3. 万金油公式 - 神经网络

确定数学公式的过程

1、公式:y = ax + b
2、参数:a = 50, b = -100
真实场景的任务,人类搞不定

神经网络的公式结构

MNIST(Mixed National Institute of Standards and Technology database)

包含了70,000张手写数字的图像,其中60,000张用于训练,10,000张用于测试,每张图像的内容只包含一个手写数字,从0到9的其中一个数字。
任务:给定一张28x28像素的灰度图像,经过一系列数学公式计算后,输出10个概率,分别代表该图像中的内容是0-9某个数字的概率

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
划重点:

  1. 这种在输入向量x和输出向量y之间,增加了一层z向量, 并且用上述格式的计算公式去计算z向量和y向量中的每一个数值的结构, 就叫做神经网络。

神经网络的参数设计

1、我可能会这样设计:设定z向量的长度为7
http://www.xdnf.cn/news/10444.html

相关文章:

  • Ansible 剧本精粹 - 编写你的第一个 Playbook
  • Spring Boot 4.0实战:构建高并发电商系统
  • 通过内核寄存器排除HardFault
  • uni-app学习笔记十七-css和scss的使用
  • 振动力学:无阻尼单自由度系统
  • 【数据结构】顺序表和链表详解(上)
  • 图文详解Java并发面试题
  • 基于Canvas实现抽奖转盘
  • 打打基础 | 从翻转链表到寄存器、汇编与内存
  • 智慧新基建数字孪生,绘就桥梁运维新画卷
  • 【STM32F407 PWM配置和应用指南 】
  • [yolov11改进系列]基于yolov11引入上下文锚点注意力CAA的python源码+训练源码
  • Spring Boot中的事件与JMS消息集成
  • Windows搭建Swift语言编译环境?如何构建ObjC语言编译环境?Swift如何引入ObjC框架?Interface Builder的历史?
  • 【论文复现】水下单光子激光雷达设计 Sequential Multimodal Underwater Single
  • PySide6 GUI 学习笔记——常用类及控件使用方法(地址类QUrl)
  • Vert.x学习笔记-EventLoop与Context的关系
  • 图像处理篇---face_recognition库实现人脸检测
  • Linux系统之gettext详解
  • Excel to JSON 插件 2.4.0 版本更新
  • 【java面试】redis篇
  • 【Linux系统】第八节—进程概念(上)—冯诺依曼体系结构+操作系统+进程及进程状态+僵尸进程—详解!
  • 【请关注】ELK集群部署真实案例分享
  • JS中的函数防抖和节流:提升性能的关键技术
  • 设计模式——模版方法设计模式(行为型)
  • 定时任务:springboot集成xxl-job-core(二)
  • Python-Selenium报错截图
  • Go 即时通讯系统:客户端与服务端 WebSocket 通信交互
  • 【HTML-15.3】HTML表单隐藏域深度解析:从基础使用到高级实践
  • Java补充(Java8新特性)(和IO都很重要)