(1)

Wang, M.; Duan, Y. RT-AVTC: A Real-Time Audio-Visual Tone Correction Network Using Multimodal Deep Learning and Causal Convolution. IJCAI 2025, 49.