Wang, Min, and Yehui Duan. “RT-AVTC: A Real-Time Audio-Visual Tone Correction Network Using Multimodal Deep Learning and Causal Convolution”. Informatica 49, no. 29 (December 21, 2025). Accessed May 12, 2026. https://www.informatica.si/index.php/informatica/article/view/10582.