项目累积----文本分类、文本标题生成、文本摘要生成

wangssd / 2023-09-04 / 原文

文本分类

模型:idcnn

模型组合结构:树形结构(通过10个模型组成树),每个模型可能是多分类

输入:取文本的前1000个词,做多分类(需对文本进行标注)

输出:根据根节点模型的分类结果,选择子节点模型进行下一步预测。(卫生计生(计划生育、引产、病原微生物菌种、其他)、知识产权(知识产权政策法规、知识产权战略规范、其他)、交通运输(交通保障、交通基础设施建设、交通事故、交通运输改革、其他)、税务(税务政策、税务统计、税务违法犯罪、其他)、粮食(粮食储备、粮食宏观调控、粮食政策预算)、防震减灾(地震监测预报、地震灾害预防、地震应急救援、其他)等)

评估结果:softmax,计算概率后的置信度

 

文本标题生成