[1]

Q. Tang, Y. Zhang, and Y. Gao, “Q-learning and Policy Gradient-Based Reinforcement Learning Method to Decision Making of Phased Array Radar Jamming”, IJCAI, vol. 49, no. 27, Dec. 2025.