当前位置：首页 > ds >正文

0-带在线搜索和自适应的尺度组合优化神经改进启发式算法(未完）（code)

ds 2025/7/4 17:05:41

code: https://github.com/federico-camerota/LRBS

文章目录

Abstract
1 Introduction
2 Preliminary and Related Work
- 使用DRL改进TSP解决方案
- Search in Neural CO
- Adaptive Methods for Neural CO
3 Searching with LRBS
- The LRBS algorithm
4 Adapting Pre-Trained Policies with LRBS
5 Experimental Results
6 Conclusion

Abstract

我们提出了一种名为受限展开束搜索（Limited Rollout Beam Search, LRBS）的束搜索策略，该策略用于基于深度强化学习（DRL）的组合优化改进启发式算法。通过在欧几里得旅行商问题（Euclidean Traveling Salesperson Problem）上使用预训练模型，LRBS 显著提升了同分布性能及对更大问题实例的泛化能力，其最优性差距优于现有的改进启发式算法，并缩小了与最先进的构造方法之间的差距。我们还将分析扩展到两个接送旅行商问题（TSP）变体上以验证结果。最终，我们运用这种搜索策略对预训练的改进策略进行离线和在线适应，从而提升了搜索性能，并超越了最近的构造启发式方法。

1 Introduction

组合优化 (CO) 问题广泛存在于多个领域，包括空中交通调度 (Bertsimas, Lulli, 和 Odoni 2011)、供应链优

http://www.xdnf.cn/news/4383.html

相关文章：

连接mysql时 Public Key Retrieval is not allowed 问题

前端面试每日三题 - Day 26

RabbitMQ 添加新用户和配置权限

龙虎榜——20250506

python的selenium操控浏览器

k8s service的类型

如何选择边缘计算服务器

HPE推出零信任网络与私有云运维解决方案

黄金量化：高频实时的贵金属API

Python实现NOA星雀优化算法优化Catboost回归模型项目实战

京东（JD）API 商品详情数据接口讲解及 JSON 示例

【基于SSM+Vue+Mysql】健身房俱乐部管理系统（附源码+数据库脚本）

大模型系列（三）--- GPT1论文研读

ETL交通行业案例丨某大型铁路运输集团ETL数据集成实践

shell-流程控制-循环-函数

Spring Boot操作MongoDB的完整示例大全

4.29 tag的完整实现和登录页面的初步搭建

【Pandas】pandas DataFrame agg

优化算法 - intro

window 显示驱动开发-线程和同步级别为零级

Git仓库基本操作

Spark 的 Shuffle 机制：原理与源码详解

内网im软件，支持企业云盘的协同办公软件推荐

【ES】Elasticsearch字段映射冲突问题分析与解决

JAVA设计模式——（十二）原型模式（Prototype Pattern）

[ linux-系统 ] 常见指令2

二、Hadoop狭义和广义的理解

STM32教程：串口USART通讯协议原理及分析（基于STM32F103C8T6最小系统板标准库开发）*详细教程*