Li, X. (2025). Cross-Modal Transformer with Dynamic Attention Fusion for Emotion Recognition in Music via Audio-Lyrics Alignment. Informatica, 49(28). https://doi.org/10.31449/inf.v49i28.11516