南华大学计算机学院在人工智能权威期刊Information Fusion上发表高水平研究论文

  新湖南客户端   2025-03-19 15:38:22

近日,南华大学计算机学院刘永彬、万亚平团队在计算机人工智能领域权威期刊Information Fusion(影响因子14.8,中国科学院一区)发表了题为“DyLas: A Dynamic Label Alignment Strategy for Large-Scale Multi-Label Text Classification”的研究论文。该论文创新性地利用因果推断(Causal Inference)理论体系中的因果干预与反事实技术,提出了一种动态标签对齐策略(DyLas),使得大语言模型(Large Language Models)在无需额外训练的情况下,自动适配大规模多标签分类任务(Large-scale Multi-label Text Classification)中的任意标签集。

大规模多标签文本分类(LMTC)是自然语言处理领域的一项重要任务,广泛应用于电子商务产品标签、新闻分类、医疗编码和法律文档分析等领域。然而,传统的监督学习方法在处理动态标签集时面临巨大挑战,尤其是标签集的动态变化和长尾分布问题(图1)。现有的方法通常需要重新训练模型以适配新的标签集,这不仅耗费大量资源,还限制了模型的灵活性和应用范围。

图1 传统方法与基于大语言模型方法对比图

研究团队利用因果推断中的因果干预和反事实技术有效减少大语言模型输出中的幻觉问题,通过双重对齐和错误检查机制实现了大语言模型在动态标签集上的高效适配(图2),显著提升了大语言模型在大规模多标签分类任务、动态标签集合场景下的性能。

图2 DyLas架构示意图

南华大学计算机学院刘永彬副教授为通讯作者,硕士生任林为第一作者,南华大学计算机学院为第一署名单位。(任林)

责编:张芷瑜

一审:张芷瑜

二审:张马良

三审:周韬

来源:新湖南客户端

我要问