摘要:为应对在未来复杂的战场电磁环境下,因敌方干扰呈现智能化、多手段等特征抗而导致的抗干扰手段不足的问题,提出了一种基于强化学习的动态自适应的可靠传输波形决策方法。以强化学习算法为基础,首先对算法中的贪婪动作选择进行优化设计,平衡了算法前后期的探索概率,并加入了自注意力机制,使算法能关注到不同输入之间的联系。采用优化后的算法建立智能体,并对智能体进行抗干扰传输方式的决策的学习训练。仿真结果表明优化后的算法相较于传统强化学习算法,在探索前期平均奖励值高10%,同时在中期收敛速度平均快20%,最后对决策输出的传输方式进行误码率性能分析,验证了波形决策策略的有效性。