location: Current position: Home >> Scientific research >> Paper achievements

基于半监督学习的中文多文档子主题划分<sup>*</sup>

Hits :

First Author : 徐晓丹

Date of Publication : 2011-01-01

Journal : 浙江师范大学学报(自然科学版)

Affiliation of Author(s) : 数理与信息工程学院

Document Type : 期刊

Issue : 第3期

Page Number : 302-305

ISSN : 1001-5051

Key Words : 多文档文摘;子主题;半监督学习;k-means聚类

Abstract : 为了能在多文档自动摘要过程中更好地划分子主题,提出了一种基于半监督学习的子主题划分方法:首先计算句子的语义相似度;然后通过层次聚类对可信度高的句子进行主题类别标记,生成少量已标记主题类别的句子集,在此基础上对所有句子进行constrained-k-means聚类,通过交叉验证的方法确定子主题的数目k;最后使用k-means聚类获得多文档的各个子主题.实验结果表明,该方法有效地提高了子主题的识别率.

Translation or Not : no

Pre One : 基于子主题和用户查询的多文档摘要系统

Next One : 项目式教学法在《Web应用程序开发》课程中的应用

Recommend this Article