数据智能(DIG)大讲堂第19期成功举办

2025 年 12 月24 日,山西大学大数据与产业研究院成功举办第 19 期数据智能(DIG)大讲堂。本期活动邀请澳大利亚国立大学郑良副教授,为研究院师生带来题为 “End-to-end training of diffusion models” 的专题报告。研究院师生通过现场聆听的方式参与,现场学术氛围十分浓厚。

dajiangtang19.png

在报告会上,郑良副教授首先指出在扩散模型的端到端训练中,直接采用梯度回传策略会导致表征坍塌这一核心难点,并分析了潜在表征坍塌的成因。为应对这一挑战,他提出“表征对齐与特征重建联合学习”的端到端训练范式,实现了在类别与文本作为条件下的高质量图像生成。随后,他介绍了团队在分类性能、空间结构与生成质量之间的内在关联等问题上的研究进展。在报告尾声,郑良副教授对扩散模型的未来研究进行了展望。

报告内容翔实具体,现场氛围热烈。在场师生就图像潜在表征与郑良副教授展开热烈讨论,表示将深度关注生成模型等研究方向,为数据智能赋能。此次大讲堂为研究院师生提供了数据智能领域的前沿视角,启迪了师生对生成模型的学术思考。

讲者简介:郑良,博士,澳大利亚国立大学副教授(tenured),ARC Future Fellow,Canva 研究科学家。2010年于清华大学获生物学、经济学学士学位,2015年获清华大学计算机科学博士学位,2018年加入澳大利亚国立大学。他为目标重识别领域贡献了诸多颇有价值的数据集与方法 (包括但不限于Market-1501,MARS,PRW,PersonX等),这些成果随后被应用于更广泛的领域。担任ACM MM'24、AVSS'24 及 ACM MM'28 的程序主席(Program Chair),担任 AVSS'27 的总主席(General Chair)。此外,担任CVPR, ICCV等重要会议的常规领域主席。担任TCSVT,ACM Computing Survey期刊编委。研究方向为面向感知与生成的表征学习方法,涵盖预训练与后训练等层面。