当前位置: 首页 > ds >正文

0-带在线搜索和自适应的尺度组合优化神经改进启发式算法(未完)(code)

code: https://github.com/federico-camerota/LRBS

文章目录

  • Abstract
  • 1 Introduction
  • 2 Preliminary and Related Work
    • 使用DRL改进TSP解决方案
    • Search in Neural CO
    • Adaptive Methods for Neural CO
  • 3 Searching with LRBS
    • The LRBS algorithm
  • 4 Adapting Pre-Trained Policies with LRBS
  • 5 Experimental Results
  • 6 Conclusion

Abstract

我们提出了一种名为受限展开束搜索(Limited Rollout Beam Search, LRBS)的束搜索策略,该策略用于基于深度强化学习(DRL)的组合优化改进启发式算法。通过在欧几里得旅行商问题(Euclidean Traveling Salesperson Problem)上使用预训练模型,LRBS 显著提升了同分布性能及对更大问题实例的泛化能力,其最优性差距优于现有的改进启发式算法,并缩小了与最先进的构造方法之间的差距。我们还将分析扩展到两个接送旅行商问题(TSP)变体上以验证结果。最终,我们运用这种搜索策略对预训练的改进策略进行离线和在线适应,从而提升了搜索性能,并超越了最近的构造启发式方法。

1 Introduction

组合优化 (CO) 问题广泛存在于多个领域,包括空中交通调度 (Bertsimas, Lulli, 和 Odoni 2011)、供应链优

http://www.xdnf.cn/news/4383.html

相关文章:

  • 连接mysql时 Public Key Retrieval is not allowed 问题
  • 前端面试每日三题 - Day 26
  • RabbitMQ 添加新用户和配置权限
  • 龙虎榜——20250506
  • python的selenium操控浏览器
  • k8s service的类型
  • 如何选择 边缘计算服务器
  • HPE推出零信任网络与私有云运维解决方案
  • javaweb-Filter
  • 黄金量化:高频实时的贵金属API
  • Python实现NOA星雀优化算法优化Catboost回归模型项目实战
  • 京东(JD)API 商品详情数据接口讲解及 JSON 示例
  • el-row el-col
  • 【基于SSM+Vue+Mysql】健身房俱乐部管理系统(附源码+数据库脚本)
  • 大模型系列(三)--- GPT1论文研读
  • ETL交通行业案例丨某大型铁路运输集团ETL数据集成实践
  • shell-流程控制-循环-函数
  • Spring Boot操作MongoDB的完整示例大全
  • 4.29 tag的完整实现和登录页面的初步搭建
  • 【Pandas】pandas DataFrame agg
  • 优化算法 - intro
  • window 显示驱动开发-线程和同步级别为零级
  • Git仓库基本操作
  • Spark 的 Shuffle 机制:原理与源码详解
  • 内网im软件,支持企业云盘的协同办公软件推荐
  • 【ES】Elasticsearch字段映射冲突问题分析与解决
  • JAVA设计模式——(十二)原型模式(Prototype Pattern)
  • [ linux-系统 ] 常见指令2
  • 二、Hadoop狭义和广义的理解
  • STM32教程:串口USART通讯协议原理及分析(基于STM32F103C8T6最小系统板标准库开发)*详细教程*