Wang, Min, and Yehui Duan. “RT-AVTC: A Real-Time Audio-Visual Tone Correction Network Using Multimodal Deep Learning and Causal Convolution”. Informatica, vol. 49, no. 29, Dec. 2025, doi:10.31449/inf.v49i29.10582.