Gao, Wei, Xiaoxin Meng, and Yuyang Zhang. “Multimodal Reinforcement Learning for Dynamic Cross-Media Advertising Budget Allocation Via DDPG and PPO Combined With Meta-Learning and Adversarial Training”. Informatica 49, no. 30 (December 21, 2025). Accessed May 12, 2026. https://www.informatica.si/index.php/informatica/article/view/11440.