基于主題模型的半監督網絡文本情感分類研究

李揚, 孔雯婧, 謝 邦昌

研究成果: 雜誌貢獻文章同行評審

摘要

針對網絡評論文本的情感分類問題中存在的數據的不平衡性、無標記性和不規范性問題,提出一種基于主題的閩值調整的半監督學習模型,通過從非結構化文本中提取主題特征,對少量標注情感的文本訓練分類器并優化指標調整閩值,達到識別用戶評論的情感傾向的目的。仿真研究證明閾值調整的半監督模型對數據非平衡性和無標記性具有較強的適應能力。在實證研究中,對酒店評論文本數據構建的文本情感分類器顯示該模型可以有效預測少數類評論樣本的情感極性,證實了基于主題模型的閩值調整半監督網絡評論文本情感分類模型在實際問題中的適用性與可行性。
貢獻的翻譯標題Study on Semi-Supervised Sentiment Classification of Web Context Based on Topic Model
原文???core.languages.zh_ZH???
期刊數理統計與管理
發行號06
出版狀態已發佈 - 2016

Keywords

  • 情感分類 不平衡數據 半監督學習 主題模型

指紋

深入研究「基于主題模型的半監督網絡文本情感分類研究」主題。共同形成了獨特的指紋。

引用此