首頁 > 期刊 > 自然科學與工程技術 > 信息科技 > 計算機軟件及計算機應用 > 科研信息化技術與應用 > 一種基于聚類的文章自動摘要方法及實現 【正文】
摘要:本文提出一種基于聚類的自動摘要方法,該方法將文章中所有句子轉換為句子向量,并且使用基于AGNES的算法對刪除離群點后的句子向量進行聚類,形成多個句子向量個數不超過設定閾值的簇,刪除句子向量個數極少的“無用”簇后,從每個簇中挑選出最能代表簇的語義的一個或者兩個句子,根據每個句子到語義中心的距離等信息從小到大確定指定數量的幾個句子作為關鍵句,拼接成文章摘要。通過在中國科普博覽網站上隨機挑選的500篇科普文章上進行實驗,上述方法各項指標均優于基于圖模型的TextRank算法以及基于統計的方法,證明了該方法的有效性和可用性。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社