[1]

M. Wang and Y. Duan, “RT-AVTC: A Real-Time Audio-Visual Tone Correction Network Using Multimodal Deep Learning and Causal Convolution”, IJCAI, vol. 49, no. 29, Dec. 2025.