Multimodal Reinforcement Learning for Dynamic Cross-Media Advertising Budget Allocation Via DDPG and PPO Combined with Meta-Learning and Adversarial Training. (2025). Informatica, 49(30). https://doi.org/10.31449/inf.v49i30.11440