首頁 > 期刊 > 自然科學與工程技術(shù) > 信息科技 > 電子信息科學綜合 > 數(shù)據(jù)分析與知識發(fā)現(xiàn) > 基于機器學習的社交媒體用戶分類研究 【正文】
摘要:【目的】充分利用社交媒體用戶的個人多維度信息,研究用戶自動分類問題。【方法】將社交媒體用戶定義為個體民眾、媒體、政府和組織4種類型,從用戶多維度信息中提取人口統(tǒng)計學、命名和自我描述三組特征,構(gòu)建基于機器學習算法的用戶自動分類模型,在Twitter真實數(shù)據(jù)集上通過實驗對比各分類算法性能,并分析各組特征的貢獻度。【結(jié)果】支持向量機和隨機梯度下降分類模型的準確率和召回率均在83%以上,命名、人口統(tǒng)計學和自我描述特征對于分類性能的影響依次遞增。【局限】由于標注的用戶數(shù)量有限,可能無法讓模型充分學習用戶特征,而且沒有考慮不同類型用戶數(shù)量的不均衡問題?!窘Y(jié)論】基于支持向量機和隨機梯度下降的分類模型能夠較準確地識別出4種類型用戶,對后續(xù)社交媒體用戶劃分研究具有借鑒意義。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社
主管單位:中國科學院;主辦單位:中國科學院文獻情報中心
一對一咨詢服務(wù)、簡單快捷、省時省力
了解更多 >直郵到家、實時跟蹤、更安全更省心
了解更多 >去除中間環(huán)節(jié)享受低價,物流進度實時通知
了解更多 >正版雜志,匹配度高、性價比高、成功率高
了解更多 >