摘要:【目的】對微博進行細粒度情感分析,將情感分為8類,并計算其情感強度值,從而盡可能還原微博用戶情感。【方法】通過微博語料分析構(gòu)建疑問詞詞表,在大連理工大學(xué)情感詞匯本體DUTIR的7類情感基礎(chǔ)上,豐富一類情感“疑”,并利用點互信息法構(gòu)建表情符號詞典,還綜合考慮否定詞和程度副詞對情感表達的影響,利用Python從新浪微博上獲取數(shù)據(jù),并用R語言的iiebaR包進行分詞,對情感進行分類并計算其強度。【結(jié)果】得到微博用戶對于糖尿病7類常用藥物的8類情感占比及情感強度,并通過正確率、召回率、F值對結(jié)果進行驗證,其中“怒”和“哀”的正確率最高,分別為85.73%和83.05%,而“樂”和“好”的召回率與F值均最高,為81%以—匕本文新增情感“疑”的正確率、召回率、F值分別為77.33%、78.58%、77.95%,均值在8類情感中排名前列,說明其情感識別較好?!揪窒蕖坑捎诒疚囊蕾囉谇楦性~典進行情感分析,因此為了更好的分析結(jié)果,情感詞典仍需進一步完善。【結(jié)論】本方法具有較高的識別率和可靠性,能夠更好地對微博上的情感分類進行細粒度分析。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社