当前位置: 首页 > backend >正文

从万有引力到深度学习,认识模型思维

从万有引力到深度学习,认识模型思维

引言

从牛顿发现万有引力定律到现代深度学习的崛起,“模型思维”始终是人类理解世界、解决问题的核心工具。它不仅是科学研究的基石,更是技术创新的底层逻辑。本文将从科学史、技术应用、认知效率等角度,系统阐述掌握模型思维的必要性。

一、模型是一种跨越时空的认知工具

1. 科学史上的经典模型

万有引力定律:牛顿通过抽象行星运动规律,建立了物理世界的统一模型,解释了有前提条件的天体运行规律。

2. 模型的本质

模型是对现实问题的抽象化表达(三十三重天、十八层地狱、地球仪和deepseek等),可以是错的、可以是未被证实的、可以是互相矛盾的。

3. 什么模型是好的模型

表达客观事物的能力
简化客观事物的能力

4. 评价模型的好坏

  1. 准确率(precision):表示得到的结果中有多少是正确结果的比例
  2. 召回率(recall):表示有多少比例好的结果被正确得到了

二、如何看待和使用模型

模型要在一定场景下起作用,越是普世的模型,越难实现,无他,因为这个世界太复杂,想想如果将这个世界抽象成一个模型,大家都在这个模型上跳舞,好像也有点无趣的可怕。

所以,场景也是模型适用的范围约束。

1. 正确性

比如搜索引擎和推理模型的检测结果,有有用和无用之分,有正确和错误之分。搜索引擎的搜索结果可能会受到算法、数据质量等多种因素的影响,有些结果可能与用户的需求不相关或者不准确。推理模型在进行推理时,也可能会因为输入数据的不完整或者模型本身的局限性而得出错误的结论。因此,在使用这些模型时,我们需要对结果进行批判性的评估,判断其正确性和实用性,而这些判断的数据又可以作为人类的反馈数据再作用于模型的优化过程中(比如强化学习)。

2. 历史作用

模型具备历史特征,大部分情况都是一个时代发展下的过渡产物,一面推动,一面阻碍。比如早期的宗教科学。

3. 发展

模型是不断发展的,因为模型是对现实世界的抽象,世界在变化,模型当然也要发展。在计算机科学领域,早期的计算机模型主要是基于冯·诺依曼架构,随着技术的发展,人们发现这种架构在处理大规模数据和并行计算时存在一定的局限性。于是,出现了各种新的计算模型,如量子计算模型、神经网络模型等,这些新模型能够更好地适应现代科技发展的需求。

4. 模型思维是什么

我上学的时候,处理比较多的是数字信号,使用了一些对序列建模的方法建立模型,再由模型对时序数据进行实时处理。
在深度学习早期的时候,将分类作为攻克的难题,所以,应运而生了感知机等为了分类的模型;在深度学习蓬勃发展时,基于视觉的分类、检测、分割等不同任务的导向,又催成了不同的模型产生 笔者文章:(视觉)分类、检测与分割在不同网络中的设计体现;再然后伴随着NLP领域的LLM应用爆炸,各种大型语言模型不断涌现,如GPT系列、BERT等,这些模型在自然语言处理的各个任务中取得了显著的成果。

模型思维是一种基于模型来思考和解决问题的思维方式。它要求我们能够根据不同的问题和场景,选择合适的模型,并对模型进行评估和改进。在面对复杂的现实问题时,我们可以通过构建模型来简化问题,抓住问题的关键因素,从而找到有效的解决方案。

三、为什么需要模型思维

世界是复杂的,包含着无数的信息和变量。如果我们试图去理解和处理所有的细节,将会陷入信息的海洋中,难以把握事物的本质。模型思维能够帮助我们对复杂的现实进行抽象和简化,提取出关键的信息和规律。

可以提高对世界的认知,可以推动科学研究(气象模型)、技术创新(计算机视觉),可以帮助决策(市场预测)。例如,人工智能领域,深度学习模型的不断发展和创新,推动了图像识别、语音识别、自然语言处理等技术的快速进步,对日常生活带来的变化不可谓不大。

参考:

  1. 龚才春.《模型的本质:简化时间的人工智能模型》
http://www.xdnf.cn/news/9029.html

相关文章:

  • ADS学习笔记(五) 谐波平衡仿真
  • 身份认证: JWT和Session是什么?
  • 深入解析 BlockingQueue:并发编程面试中的高频考点!
  • SDL2常用函数:SDL_RendererSDL_CreateRendererSDL_RenderCopySDL_RenderPresent
  • 数据库工程师备考
  • 第三届京麒CTF Web
  • ClickHouse性能优化技术深度解析与实践指南
  • (4)-Fiddler抓包-会话面板和HTTP会话数据操作
  • 多模态大语言模型arxiv论文略读(九十三)
  • Odoo 自动化规则全面深度解析
  • 探秘谷歌Gemini:开启人工智能新纪元
  • 基于树莓派的贪吃蛇游戏机
  • 【科研绘图系列】R语言绘制气泡图(bubble plot)
  • 噪声建模在一小时:最小化准备工作的自监督低光RAW图像去噪
  • ArcGIS 与 HEC-RAS 协同:流域水文分析与洪水模拟全流程
  • 数字展厅建设需融合创意设计与实用功能,打造多维用户体验!
  • 动态规划(7):背包问题
  • 解决 docker pull镜像失败
  • DEC Global:技术赋能如何重塑投资者决策模式?
  • Three.js搭建小米SU7三维汽车实战(5)su7登场
  • 深度解析新能源汽车结构与工作原理
  • 多端一体开发:iVX 如何让「一次开发,全平台部署」从理想照进现实
  • Android中一次完整的ipc通信过程
  • Vue 3.0中复杂状态如何管理
  • ARINC818_FILE
  • jquery基础知识
  • 批量转存夸克网盘内容并分享实操教程
  • charAt()
  • ArkUI:鸿蒙应用响应式与组件化开发指南(一)
  • RuoYi前后端分离框架集成UEditorPlus富文本编辑器