论文略读:AutoG: Towards automatic graph construction from tabular data
ICLR 2025 6666
近年来,图机器学习(Graph Machine Learning, GML)取得了显著进展,并广泛应用于多个领域。然而,GML 社区的研究重点大多集中于构建更强大的图模型,而常常忽视了一个关键的前置步骤:如何从常见的数据格式(如表格数据)中构建合适的图结构。图的构建是应用图模型的基础,但这一过程在现有研究中仍缺乏系统性探索和正式定义。
为填补这一空白,我们的研究旨在形式化图构建问题,并提出有效的解决方案。在实现这一目标的过程中,我们识别出两个核心挑战:
-
缺乏专门的数据集来支持图构建方法的形式化与评估;
-
现有自动化构建方法适用范围有限,在许多场景下仍需依赖繁琐的人工工程才能生成高质量的图结构。
针对上述挑战,本文提出了两项主要贡献:
-
第一,我们引入了一套专门的数据集,用于形式化图构建问题并系统评估不同方法;
-
第二,我们提出了基于大语言模型的解决方案 AutoG,可在无需人工干预的情况下自动生成高质量图结构。
实验结果表明,图结构的质量对下游任务性能具有显著影响,而 AutoG 所生成的图结构在性能上可媲美人工构建的高质量图,验证了其有效性与实用性。
项目代码已开源,地址为:https://github.com/amazon-science/Automatic-Table-to-Graph-Generation。