当前位置: 首页 > web >正文

嵌入式学习-(李宏毅)机器学习(2)-day29

 十五个作业

 不同类型的Functions

两大类任务

一个是Regression(回归) 一个是  Classification(分类)

一个是给出一个数值,一个是从类别中选择一个

还有一类任务 Structured Learning 机器要学会创造文件 

机器学习预测频道第二天的观看人数的三个步骤

1,我们要写出一个带有未知参数的函数

猜测 y = b + wX1

w 是 weight

b 是 bias

2,Define Loss from Training Data 定义一个损失函数

Loss :how good a set of values is.

预估的结果和真实的结果的差距

计算差距 

真实的值叫做label

把三年每一天的误差都加起来

然后求一个均值 : L

L越大, 这一组参数越不好

L越小,这一组参数越好

计算误差的公式有很多

 MAE,MSE,交叉熵

将计算的Loss画一个等高线图,越靠近蓝色就代表参数设置的越好,Loss越小

 

 3,一个未知数 Gradient Descent 梯度下降

只有一个w的时候的图像

选择一个初始的点W0,随机的选择

计算W对Loss的微分,计算切线斜率, 

自己需要自己设置的东西是 超参数 hyperparameters

向左或者向右走的步伐就是 learning rate  自己决定

什么时候停下来,算出微分是0,或者更新次数达到已设置的值

容易出现Local minnima的问题

还有梯度消失和梯度爆炸

 3,两个未知数 Gradient Descent 梯度下降

机器学习的三个步骤

1,写一个函数

2,定义一个loss函数,损失函数

3,optimization

 Linear models

Linear model也许太过简单了

由于model的限制叫做 Model Bias

我们需要写一个更复杂的,有位置参数的function

就算是曲线,也可以用piecewise linear 

 怎么把蓝色function写出来呢

有一个就是sigmod function

x  -> max    y -> c

x -> -max  y -> 0

改变 w b c 的区别如图

 所以红的得线可以用每个蓝色sigmod 函数加起来,再别忘了一个常数constant  b,就是橙色函数

http://www.xdnf.cn/news/16247.html

相关文章:

  • 图片查重从设计到实现(2)Milvus安装准备etcd介绍、应用场景及Docker安装配置
  • SkyWalking异步采集spring gateway日志
  • jax study notes[19]
  • 【C++】简单学——list类
  • uniapp写app做测试手机通知栏展示内容
  • 暑期算法训练.7
  • VR全景制作的流程?VR全景制作可以用在哪些领域?
  • 最短路算法
  • 美林数据用大模型重构电能质量评估,让隐蔽合规问题无所遁形
  • es 和 lucene 的区别
  • 比例谐振控制器(PR控制器)在交流系统中的应用原理详细解析
  • 【OpenCV篇】OpenCV——03day.图像预处理(2)
  • AI大模型各类概念扫盲
  • 汽车需求管理的关键要素及适合汽车行业的最佳需求管理解决方案Jama Connect
  • 《设计模式之禅》笔记摘录 - 9.责任链模式
  • 4️⃣字典(dict)速查表
  • 阶段1--域名服务器
  • Java开发岗面试记录合集
  • 一二章笔记总结
  • Ubuntu系统下FFmpeg源码编译安装
  • 【Pytorch】数据集的加载和处理(二)
  • 纯CPU场景下C++的分布式模型训练框架设计思路
  • 刷完jetpack后无法打开安装的浏览器的解决办法useful
  • Linux dd命令 数据备份、转换与磁盘操作的终极工具
  • 分布式任务调度实战:XXL-JOB与Elastic-Job深度解析
  • OpenLayers 快速入门(六)Interaction 对象
  • 模拟实现消息队列项目
  • 7月23日星期三今日早报简报微语报早读
  • C基础 07_综合案例《猜拳游戏》
  • Android NDK与JNI深度解析