我院闫涛副教授在通用三维形貌重建领域的研究成果被人工智能领域国际顶级期刊TPAMI接收

我院机器视觉与信号处理中心在通用三维形貌重建领域取得重要进展。由闫涛副教授(第一作者)、钱宇华教授(通讯作者)领衔,联合张江峰博士、王婕婷副教授和梁吉业教授共同完成的创新性研究成果"SAS:A General Framework Induced by Sequence Association for Shape from Focus",近日被人工智能领域国际顶级期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence》(TPAMI,影响因子20.8)接收。

该研究从多视图学习视角提出了基于序列关联的通用三维形貌重建框架,是Shape from Focus(SFF)领域的重要突破。值得关注的是,这是国内SFF研究首次登上TPAMI期刊,也是国际上该领域在TPAMI发表的第三篇论文(前两篇分别发表于1994年和2012年)。

随着智能制造、虚拟现实等前沿技术的迅猛发展,构建宏微观跨尺度统一的通用三维形貌重建框架面临三大核心科学挑战:首先,在成像特征层面,宏观场景基于光学成像系统,具有大景深和丰富纹理特征的特点;而微观场景依托显微成像技术,呈现小景深和弱纹理特性。现有方法难以有效实现这种跨尺度特征的统一建模与重建。其次,在方法学层面,基于深度学习的SFF方法虽然取得了一定进展,但其数据驱动的本质导致对真实复杂场景的泛化能力存在明显局限,难以满足实际应用需求。最后,在模型设计层面,传统SFF方法在序列图像间的关联特征提取方面存在不足,未能充分利用序列间的时空关联信息,制约了重建精度的进一步提升。

针对上述挑战,本研究创新性地提出了一种基于序列关联的通用三维形貌重建框架(图1)。该框架从多视图学习的理论视角出发,具有以下创新性突破:

(1)理论创新:揭示了多视图趋同性对提升重建精度的关键作用,建立了更紧的泛化误差界,为宏微观跨尺度重建提供了理论保障。

(2)方法创新:通过构建序列关联机制,实现了宏观场景语义信息与微观场景细节特征的有机融合,突破了传统方法在跨尺度重建中的局限性。

(3)性能突破:该框架不仅显著提升了宏观场景的重建质量,更将三维重建精度推进至亚微米级光学成像极限,为精密制造、生物医学等领域的微观测量提供了新的技术手段。

20250613102722.png

图1 序列关联引导的通用三维形貌重建框架

论文在九类不同数据集上进行了实验验证(图2),SAS方法不仅优于先进的模型设计类SFF方法,而且在泛化性方面优于主流的深度学习类SFF方法,特别是对于开放世界中的宏微观场景中表现出卓越的适应性。

20250613102759.png

20250613102815.png

图2 SAS方法的性能分析

该研究工作得到国家自然科学基金重大项目(T2495250)、国家自然科学基金重点项目(62136005)、国家自然科学基金区域创新发展联合重点项目(U21A20473,U24A20253)、国家自然科学基金(62472268,62306170),中央引导地方科技发展资金项目(YDZJSX20231C001, YDZJSX20231B001)等支持。

TPAMI期刊于1979年建刊,是国际上公认的人工智能领域顶级期刊,同时也被中国计算机学会(CCF)推荐为人工智能领域的A类期刊,主要刊登人工智能领域的高质量前沿研究成果。