当前位置: 首页 > backend >正文

【排队论】Probabilistic Forecasts of Bike-Sharing Systems for Journey Planning

Probabilistic Forecasts of Bike-Sharing Systems forJourney Planning

在这里插入图片描述

abstract

我们研究了对共享单车系统(BSS)车站未来自行车可用性进行预测的问题。这是相关的,以便提出建议,保证用户能够进行旅行的概率足够高。为此,我们使用从BSS的排队理论时间非均匀模型中获得的概率预测。该模型已参数化,并使用巴黎市V’elib’BSS的历史数据成功验证。
我们对共享单车研究中常用的标准均方根误差(RMSE)进行了批判,将其作为预测准确性的指标,因为它没有考虑到真实系统中固有的随机性。相反,我们引入了一种基于评分规则的新指标。我们将模型的平均得分与文献中使用的经典预测因子进行比较。我们证明,在长达几个小时的预测范围内,我们的模型的表现优于这些模型。我们还讨论了,一般来说,测量当前可用自行车的数量仅适用于长达几个小时的预测范围。

一、要点

核心问题:如何预测共享单车站点未来自行车的可用性?
目标: 为用户提供高概率的行程可行性建议。
方法: 基于排队理论的时间非齐次模型。
数据验证:使用巴黎Vlib’系统的历史数据进行模型参数化和验证。

1.1 传统预测方法的局限性:RMSE的困局

传统方法采用RMSE(预测值和实际值的均方误差)进行评估,其在共享单车系统中具有局限性。忽略了系统的随机性(不可能完全准确,且永远不能为0),无法满足用户需求(无法表明用户是否借到车),RMSE具有下界。

  • 传统指标:均方根误差(RMSE)广泛用于评估预测精度,
  • 根本缺陷:RMSE未能充分考虑共享单车系统的固有随机性。这样导致预测误差不可避免。
  • 理想情况下的RMSE:即使拥有完美信息,RMSE也无法达到零。经过案例研究,不同参数设置下,最佳预测器的RMSE仍然较高。
  • 用户需求与RMSE脱节:用户更关心“能否成功骑行",而非精确的自行车数量
    在这里插入图片描述

1.2 概率预测的优势:超越点估计

  • 概率预测:预测未来自行车数量的概率分布而非单一数值
  • 用户价值:直接提供用户关心的信息,如“出发站有自行车的概率”
  • 系统优化:帮助运营商识别高风险站点,优化调度
  • 更全面的信息:提供更丰富的决策依据,例如平均值、方差等。

预测某个站点在半个小时后有车的概率是85%,对 用户 来说告诉成功的可能性有多大,对于 运行商 来说可识别哪些站点更容易出现空战或者满战的情况,从而进行更精准的调度。

二、数学模型

具体模型设计待补充

三、排队论模型:共享单车站点的数学建模

3.1 模型特点

核心思想:将共享单车站点建模为一个排队论系统。站点的两个过程–取车和还车–不是匀速的且是随机的;用时间非齐次性泊松过程的数学模型来描述;到达过程、离去过程都服从泊松过程。

  • 时间非齐次性:充分考虑一天内不同时间段用户行为的差异(例如,早晚高峰到达和离开的速率肯定不一致)
  • 泊松过程假设:简化模型,便于参数估计和分析
  • 站点独立假设:简化分析,适用于大规模BSS网络(现实中站点之间会相互影响,但在站点数量足够多的情况下,这个假设盒里,且被一些理论和实证研究支持。)

模型的亮点在于抓住共享单车系统随机性的特点,还能预测出未来某个时间点站内的有多少车的概率是多少。

3.2 模型参数

例如,每15分钟一段,统计每段内多少车被取走,又有多少车被还回来。

  • 参数估计:使用Vlib’系统历史数据估计到达率和离开率。
  • 分段常数假设: 将一天划分为多个时间窗口,假设在每个窗口内速率恒定

3.3 模型验证

  • 模型验证:验证到达和离开过程是否符合泊松分布。
  • K-S检验:使用Kolmogorov-Smirnov检验评估数据与泊松分布的拟合程度。
    结果表明,大部分站点的数据确实比较接近泊松分布,验证了假设是靠谱的。

四、概率评分规则:评估概率预测的新标准

4.1 评分规则

传统方法采用RMSE(预测值和实际值的均方误差)进行评估,其在共享单车系统中具有局限性。忽略了系统的随机性(不可能完全准确,且永远不能为0),无法满足用户需求(无法表明用户是否借到车),RMSE具有下界。

即不去预测未来某一个确定的值,而去预测未来某个时间点,站点有X辆车的概率是多少。

衡量判断预测能否帮助用户判断是否成功借到车。

  • 评分规则:用于评估概率预测准确性的度量标准。
  • Proper Scoring Rule:鼓励预测者诚实报告真实概率分布。
  • 常用评分规则:Brier score, Spherical score, Logarithmic score.
  • 用户中心评分规则:设计新的评分规则直接评估行程可行性预测
    在这里插入图片描述

4.2 新定义的规则:用户中心评分规则

  • 用户需求:用户更关心"是否有自行车可用",而非具体数量
  • 阈值策略:用户根据预测概率p和阈值 p ∗ p^* p、决定是否前往站点。
  • 评分规则设计:基于用户效用函数(衡量用户满意度),设计新的评分规则,

在这里插入图片描述
用户有一个效用函数,用于衡量用户满意度。比如,成功借到车的效用高于没借到车的效用,用户会根据预测的概率p和一个自己设定的阈值 p ∗ p^* p来决定是否去站点。如果预测概率大于等于阈值,就去;否则不去。评分规则是根据用户最终的决策结果和实际发生的情况来打分。

理解:用户会预测去完站点i有车的概率为p=85%,若大于其阈值 p ∗ p^* p=80% ,执行Go.去了之后能不能借到车是一个新的效用函数。因为现实情况是可能借到车,也可能借不到。
用户因为预测做出了正确的决策,得分就高;反之,则低。
这样可以直接评估模型在帮助用户决策方面的表现。

五、实验结果:概率预测模型的优越性

使用巴黎Vib’的真实数据,比较了我们提出的排队模型(QMP),历史预测模型(HP)和最后值预测模型(LVP)三种方法在不同评分规则下的表现。
预测时长:5min-10h不等
主要发现:

  • QMP模型在中短预测(2-5h)中表现最佳
  • HP模型在长期预测中略有优势
  • LVP模型在所有预测时长中表现最差
    在这里插入图片描述

六 错误决策概率分析:阈值策略下的模型表现

在这里插入图片描述
显然有不同的预测模型p以及不同的阈值p*,那么如何选择正确的模型和阈值是关键的。所以研究者分析了不同预测模型在不同的阈值下,导致错误决策的概率。结果发现,QMP模型表现更好,无论用户设定的阈值是高还是低,它导致错误决策的概率都相对较低。所以QMP模型不仅预测的准,而且能够更好的指导用户的实际决策。

七、结论和展望

结论

  1. 基于排队论的BSS站点可用性预测模型有效
  2. 概率预测和评分规则评估方法更贴合实际需求
  3. QMP模型在中短期预测中优于传统方法

展望

  1. 考虑站点间的相关影响,构建更精细的网络模型
  2. 验证模型在其他BSS数据上的泛化能力
  3. 探索更复杂的用户行为和环境因素对预测的影响。
http://www.xdnf.cn/news/596.html

相关文章:

  • 日语学习-日语知识点小记-进阶-JLPT-N2阶段(6): - (1)ても てでも特别强调(2)~もしないで = 聞かないで:根本不做某动作”
  • 【Java笔记】volatile 关键字
  • javaSE.四大函数式接口
  • Vue3基础
  • 关于一对多关系(即E-R图中1:n)中的界面展示优化和数据库设计
  • leetcode刷题日记——两数之和
  • Linux——firewalld防火墙
  • 2021-11-10 C++蜗牛爬井进3退1求天数
  • 【C++算法】63.字符串_二进制求和
  • 深度解析AI大模型中的模型微调技术:从基础到实践
  • 知识就是力量——一些硬件的使用方式
  • 第二十七讲:AI+农学导论
  • Python基于知识图谱的医疗问答系统【附源码、文档说明】
  • python基础知识点(3)
  • JAVA学习-多线程
  • linux查看目录相关命令
  • Linux系统中的网络传输、网络管理以及软件仓库的构建
  • @EnableAsync+@Async源码学习笔记之四
  • 2025年第十五届MathorCup数学应用挑战赛D题论文全网首发
  • MSCKF——运动方程IMU状态递推(Propagation)
  • 深度补全网络:CSPN++ 有哪些开源项目
  • 2025华中杯挑战赛B题【单车调度】原创论文讲解
  • docker 搭建nacos 2.2.1版本单机版
  • 国产SMT贴片机自主技术突破解析
  • A股周度复盘与下周策略 的deepseek提示词模板
  • Unreal 从入门到精通之如何接入MQTT
  • 【开发心得】Dify部署ollama模型的坑[8]
  • 【漫话机器学习系列】210.标准化(Standardization)
  • [Java · 初窥门径] Java 注释符
  • DEV-c++怎么免打头文件中英文切换