当前位置：首页 > news >正文

2025年ASOC SCI2区TOP，强化学习驱动双邻域结构人工蜂群算法RL_DNSABC，深度解析+性能实测

news 2025/6/14 6:14:44

1.摘要

人工蜂群算法（Artificial Bee Colony，ABC）因其结构简单且在全局优化任务中的有效性而被广泛认可。然而，传统 ABC 算法中固定的邻域结构限制了其在动态且复杂搜索空间中的适应性。为了解决上述问题，本文提出了基于强化学习驱动的双邻域结构人工蜂群算法（RL_DNSABC）。RL_DNSABC方法引入了双邻域结构，能够更细致地在搜索空间中实现探索与开发的权衡。通过强化学习机制，根据算法运行过程中的性能反馈，动态调整邻域结构的大小，从而实现自适应搜索。基于双邻域结构，RL_DNSABC采用一种新颖的个体选择机制和三种带有不同偏好的改进搜索策略。

2.人工蜂群算法ABC原理

【智能算法】人工蜂群算法（ABC）原理及实现

3.强化学习驱动双邻域结构人工蜂群算法RL_DNSABC

RL_DNSABC算法结合了随机邻域结构（RNS）与欧几里得距离邻域结构（EDNS），构建双邻域搜索框架，以增强搜索的多样性与灵活性。RNS的邻域大小由强化学习模块RL_RNS自适应调节，使算法能够动态响应搜索环境的变化。考虑到传统适应度评估机制的局限性，RL_DNSABC 引入了改进的个体选择方法，并基于双邻域结构设计了三种具有不同偏好的搜索策略，以更好地在全局探索与局部开发之间取得平衡。

RL_DNSABC流程图

双邻域结构

RNS每个解 $X_i$ 会从整个种群中随机选取 $k$ 个个体作为其邻居，EDNS通过计算每个解 $X_i$ 与种群中其他个体之间的平均欧几里得距离，来调整其邻域范围。
$md_i=\frac{\sum_{i=1}^{SN}d_{i,j}}{SN-1}$

RNS,EDNS

对于不同个体 $X_i,X_j$ ,如果 $d_{i,j}$ 小于 $md_i$ ，则 $X_j$ 属于 $X_i$ 的EDNS邻居：
$S_i^2 = \begin{cases} S_i^2 \cup X_j, & \text{if } d_{i,j} < md_i \\ S_i^2, & \text{otherwise} \end{cases}$

RNS中基于强化学习自适应邻域搜索

在传统ABC算法中，邻域搜索的规模是固定的。实际上，不同的优化问题往往需要不同的邻域规模以获得更好的性能。为克服这一局限，本文将Q 学习机制引入随机邻域结构（RNS）中，提出了自适应邻域调整模块 RL_RNS，能够根据搜索过程中的表现动态调整邻域大小。

在ABC中，适应度函数用于指导个体选择，但在求解数值最小化问题的后期阶段，目标函数值趋近于零，不同解可能获得几乎相同甚至完全相同的适应度值，导致优秀个体在观察蜂阶段无法被有效区分和优先选择。本文提出一种基于强化学习邻域结构（RL_RNS）的新型个体选择方法，该方法通过构建个体 $X_i$ 的RL_RNS邻域集合 $S_i^1$ :
$X_{irb}=\left\{\exists X^{*}\in S_{i}\left|f\left(X^{*}\right)\leq f\left(X\right),\forall X\in S_{i}\right.\right\}$

基于RL_RNS和EDNS的不同改进搜索策略

在ABC中，雇佣蜂主要负责全局搜索，而观察蜂则依据雇佣蜂传递的信息进一步挖掘优质解，理论上应发挥收敛优化作用。然而，两个阶段采用相同的搜索策略，导致算法偏重探索、收敛能力不足，限制了优化性能。本文提出了一种基于 RL_RNS 的改进搜索策略，在保持搜索多样性的同时，有效提升收敛效率：
$v_{i,j}=x_{ir,j}+\phi_{i,j}\cdot(x_{ir,j}-x_{ik,j})+\psi_{i,j}\cdot(x_{irb,j}-x_{ik,j})$
利用EDNS的概念设计另一种改进的搜索:
$v_{i,j}=x_{ieb,j}+\phi_{i,j}\cdot(x_{ieb,j}-x_{k,j})$

RL_DNSABC改进搜索策略

RL_DNSABC伪代码

4.结果展示

5.参考文献

[1] Ye T, Zhang P, Wang H, et al. Reinforcement learning-driven dual neighborhood structure artificial bee colony algorithm for continuous optimization problem[J]. Applied Soft Computing, 2025, 169: 112601.