我院一篇论文被2024年数据挖掘领域国际顶会SIGKDD接收

近日,山西大学大数据科学与产业研究院一篇论文《TSC: A Simple Two-Sided Constraint against Over-Smoothing》被2024年数据挖掘领域国际顶会The 30th ACM SIGKDD Conference on Knowledge Discovery and Data Mining接收。

《TSC: A Simple Two-Sided Constraint against Over-Smoothing》

论文作者:彭甫镕 刘康 逯暄(通讯) 钱宇华 闫泓任 马超

图卷积神经网络(GCNs)是学习图结构数据的主流方法之一,广泛应用于社交网络和产品推荐等领域。然而,传统的GCNs存在过平滑问题。即随着GCNs层数的增加同一连通分量内的节点逐渐趋同。我们认为这一现象可能源于两个因素:(a)邻居质量下降:随着层数增加, 各节点聚合的邻居信息差异性减小,邻居质量下降,导致节点表示趋同;(b)邻居数量呈指数增长:随着层数的增加节点的邻居数量急剧上升,节点自身的特性被聚合的邻居信息所淹没。为了应对这两个问题,我们提出了一种双边约束方法 (TSC),该方法包括两种简单有效的技术:随机屏蔽和对比约束。随机屏蔽作用于特征矩阵的列,既保留了节点的自身特性,又有效控制了节点聚合邻居信息的程度,防止节点自身特性被淹没,并避免了因邻居质量下降而导致的特征趋同;对比性约束作用于特征矩阵的行,通过增强节点间的差异性,进一步阻止了节点特征的趋同,并提升了模型在分类任务上的表现。此外,TSC 是一个插件模块,它可以容易地集成到流行的GCNs架构中。在真实世界图数据集上的实验分析表明,我们的方法有效地防止了节点特征的趋同,显著缓解了深度GCNs性能的下降。

微信截图_20240522172003.png

SIGKDD(Special Interest Group on Knowledge Discovery and Data Mining)是数据挖掘和知识发现领域的顶级国际会议之一,也是数据挖掘领域最重要的国际会议。由 ACM (Association for Computing Machinery)的数据挖掘及知识发现专委会(SIGKDD)主办,被中国计算机协会推荐为 A 类会议。该会议每年举办一次,旨在促进数据挖掘和知识发现领域的学术交流与合作。会议提供了一个国际性的平台,让学术界和工业界的研究人员、工程师、学生等共同探讨数据挖掘和知识发现领域的最新进展、技术创新和应用实践。