Xulong Zhang

Executive Director

Xulong Zhang is a Ph.D. in computer application technology from Fudan University under the supervision of Wei Li. His research during the doctoral period focused on music artificial intelligence, specifically on singing voice detection and singer identification under the sub-topics of music information retrieval. Currently, he work as a senior algorithm researcher at PAT. His main project involves researching technology and applications related to text-to-speech and AI music.

He has served as an external corporate mentor for the University of Science and Technology of China since 2021, where he have jointly supervised seven graduate students. Additionally, starting from 2023, he hold the position of external mentor at Tsinghua Shenzhen International Graduate School. He serves as a member of the Federal Data and Federal Intelligence Special Committee, and he was selected for the 2023 Youth Project of the Shanghai Oriental Talent Program. He actively participate in professional organizations and scholarly communities, serving as a reviewer of well-known Jounals and Conferences such as MM, TASLP, ICASSP and EMNLP. He is also a member of CAA (ID:E1412095260M), CCF (ID:N7554M), ACM (ID:5318755) and IEEE (ID:98053721).

Interests

Federated Large Models
Trusted Computing
Graph Computing

Awards

1. 2023 Youth Project of the Shanghai Oriental Talent Program / 2023上海市东方英才青年项目

中文期刊文章

面向动态环境的智能体自我进化综述 (2026), 《智能系统学报》（CCF-T2,北大核心）
具身智能VLA的多模态感知技术综述 (2025), 《大数据》（CCF-T2）
基于潜空间拼接与对比学习的语音匿名方法研究, (2025), †First Author, 《大数据》（CCF-T2）
多代码智能体研究与应用综述, (2025), †First Author, 《大数据》（CCF-T2）
大型视觉语言模型幻觉综述, (2025), †First Author, 《大数据》（CCF-T2）
结合少样本逻辑推理的多模态机器人故障解释一致性方法 (2025), 《大数据》（CCF-T2）
基于多智能体协作的移动边缘计算任务卸载及调度策略 (2025), 《大数据》（CCF-T2）
面向具身智能的视觉-语言-动作模型动作表征和生成策略综述 (2025), 《计算机应用》北大核心（CCF-T2）
人工智能生成式内容技术概述, (2025), †First Author, 《大数据》,12(1),（CCF-T2）
基于One-Class学习的鲁棒音频真伪识别 (2025), 《大数据》,11 (03),（CCF-T2）
基于可逆网络双嵌入和攻击层的鲁棒音频水印方法, (2025), †First Author, 《大数据》,11 (04),（CCF-T2）
基于多模态大模型的具身智能体研究进展与展望 (2025), 《大数据》,11 (03),（CCF-T2）
基于大模型的具身智能任务规划研究：从单智能体到多智能体 (2025), 《大数据》,11 (02),（CCF-T2）
基于深度卷积和自注意力机制的端到端地震波降噪方法 (2025), 《大数据》（CCF-T2）
大语言模型长文本推断优化技术综述 (2025), 《大数据》（CCF-T2）
沙尘图像视觉增强技术综述 (2025), 《大数据》,11 (01),（CCF-T2）
深度伪造音频生成与鉴伪技术综述 (2025), 《大数据》,11 (05),（CCF-T2）
深度图表示学习：方法、应用与挑战, (2025), †First Author, 《大数据》（CCF-T2）
视频深度伪造检测的泛化性问题：方法、挑战与技术进展 (2025), 《大数据》（CCF-T2）
基于分层联邦框架的音频模型生成技术研究 (2024), 《智能系统学报》(CCF-T2,北大核心)
基于生成对抗网络的多特征融合去雾技术 (2024), 《大数据》,10 (04),（CCF-T2）
情感语音合成综述 (2024), 《大数据》,10 (05),（CCF-T2）
数字说话人脸生成技术综述 (2024), 《大数据》,10 (05),（CCF-T2）
面向非平行语料的语音转换技术综述 (2024), 《大数据》,10 (03),（CCF-T2）
基于数字孪生技术的元宇宙空气污染物浓度推断模型 (2023), 《大数据》,9 (01),（CCF-T2）
基于算力网络的元宇宙分层处理模型设计 (2023), 《大数据》,9 (01),（CCF-T2）
虚拟人形象合成技术综述 (2023), 《大数据》,9 (03),（CCF-T2）
表现性语音合成综述 (2023), 《大数据》,9 (06),（CCF-T2）
基于U-Net和BGRU-RNN的实用歌声检测系统 (2019), 《微型电脑应用》
数据增强基础上使用卷积神经网络进行闻诊（英文） (2019), 《复旦学报(自然科学版)》(北大核心)
用于检测音乐借用中短相似片段的方法（英文） (2019), 《复旦学报(自然科学版)》(北大核心)
流行音乐主旋律提取技术综述 (2017), 《计算机科学》(CCF-T2,北大核心)
基于擦除码的高效云存储数据冗余方案 (2015), 《计算机工程与设计》(CCF-T3,北大核心)
一种面向云服务的自主信誉管理机制 (2013), 《武汉大学学报(理学版)》(北大核心)

Xulong Zhang

Executive Director

Publications

中文期刊文章