PDF
摘要
对民族地区的网络舆情安全监测中,舆情文本多采用民族语言,这就导致对其进行情感分析时会因民族语言的情感标注数据量的不足而使得准确率下降、时间成本增加.为此,将“提示学习”这一新兴热点技术引入情感分类中,并提出了基于提示模板构建与标签描述的小样本文本分类算法(Prompt Tuning and Label Description, PTLD).首先,利用预训练掩码语言模型作为目标任务构造提示模板;其次,将提示学习中的提示微调与提示模板结合起来用于情感分析中;再次,将标签描述设计为模型对特定任务生成特定类型输出的引导;最后,以藏语数据集为例,在自建的数据集上进行有无提示学习的对比实验.结果表明PTLD算法因结合了提示模板与标签描述,从而与基于基线模型的算法相比,在14种提示模板上平均准确率提升约1.82%,在单个提示模板中最高准确率提升约15.39%.另外,在加标签描述与不加标签描述的对比实验中,加标签描述的准确率提升约23.56%.因此,进一步证明了所提出PTLD算法在分类数据集数据量不足的情况下仍能保证分类的高性能实现.
关键词
情感分类
/
小样本学习
/
提示学习
/
提示模板构建
/
微调
Key words
基于提示学习的民族地区安全治理中舆情检测技术研究[J].
西南民族大学学报(自然科学版), 2025, 51(6): 612-623 DOI:10.26978/j.cnki.xnmdzk.2025.06.003