(1)

Tang, Q.; Zhang, Y.; Gao, Y. Q-Learning and Policy Gradient-Based Reinforcement Learning Method to Decision Making of Phased Array Radar Jamming. IJCAI 2025, 49.