为解决信息量爆炸背景下思政案例文本篇幅长、议题复杂、冗余信息多导致的人工摘要效率低下问题,以及现有纯抽取式模型忽略语句间逻辑关联、纯生成式模型易偏离政策导向的缺陷,提出一种聚类到句子算法(CLUSTER2SENT:CLUSTER to SENTence)。该算法通过提取与摘要相关的重要话语-对重要话语进行聚类分析-为每个聚类生成摘要文本的3步流程实现思政案例摘要自动生成。实验结果表明,CLUSTER2SENT算法在ROUGE-1指标比纯抽取式对应模型高出8个百分点,证实了该算法的有效性;同时,在构建摘要语料库时创建节结构,可显著提升模型性能。