摘要
針對網絡評論文本的情感分類問題中存在的數據的不平衡性、無標記性和不規范性問題,提出一種基于主題的閩值調整的半監督學習模型,通過從非結構化文本中提取主題特征,對少量標注情感的文本訓練分類器并優化指標調整閩值,達到識別用戶評論的情感傾向的目的。仿真研究證明閾值調整的半監督模型對數據非平衡性和無標記性具有較強的適應能力。在實證研究中,對酒店評論文本數據構建的文本情感分類器顯示該模型可以有效預測少數類評論樣本的情感極性,證實了基于主題模型的閩值調整半監督網絡評論文本情感分類模型在實際問題中的適用性與可行性。
貢獻的翻譯標題 | Study on Semi-Supervised Sentiment Classification of Web Context Based on Topic Model |
---|---|
原文 | ???core.languages.zh_ZH??? |
期刊 | 數理統計與管理 |
發行號 | 06 |
出版狀態 | 已發佈 - 2016 |
Keywords
- 情感分類 不平衡數據 半監督學習 主題模型