本文由《開放教育研究》雜志授權(quán)發(fā)布 作者:潘怡、葉輝、鄒軍華 摘要
一、引言 自2000年起,伴隨計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)及多媒體教育的興起,E-learning(吳戰(zhàn)杰,2013)發(fā)展迅速,在線學(xué)習(xí)與傳統(tǒng)課堂學(xué)習(xí)效果的比較成為研究熱點(diǎn)。盡管多數(shù)學(xué)者相信E-Learning的學(xué)習(xí)效果和傳統(tǒng)授課方式的效果類似,但仍有不少人堅(jiān)持認(rèn)為前者的學(xué)習(xí)效果有待改進(jìn)。美國Pew研究中心對2124名成人抽樣調(diào)查結(jié)果表明,僅29%的受訪者認(rèn)為在線學(xué)習(xí)與傳統(tǒng)課堂授課效果相似(Bell & Federman,2013)。究其根本,這與E-learning未能在講授者與學(xué)習(xí)者之間架起有效的溝通橋梁不無關(guān)系。由于講授者不能及時(shí)從學(xué)習(xí)者處獲得有效反饋,各類E-learning平臺(tái)目前僅能呈現(xiàn)較低層次的學(xué)習(xí)過程,講授者無法引導(dǎo)學(xué)習(xí)者展開深入探討。 文本情感分析,又稱情感分析(Sentimen Analysis),采用數(shù)據(jù)挖掘技術(shù)對用戶發(fā)布文本中所包含的觀點(diǎn)、情緒等進(jìn)行分析,對用戶的情感傾向如“贊同”“反對”或“無所謂”等作出判斷。隨著Web2.0的興起與發(fā)展,用戶主動(dòng)發(fā)布信息越來越多,如各種新聞、產(chǎn)品評論、論壇帖子、Blog等,他們不僅是信息瀏覽者,也是信息提供者。這些由用戶主動(dòng)發(fā)布的信息往往表達(dá)了他們對某一主題或事件的看法,或?qū)δ骋划a(chǎn)品的意見,有的還蘊(yùn)含了用戶的興趣愛好和個(gè)性特征,反映了用戶對某一事物的情感或態(tài)度。如果將文本分類研究視角擴(kuò)展至發(fā)布在學(xué)習(xí)平臺(tái)上的評論,識(shí)別隱含其中的情感信息,發(fā)現(xiàn)學(xué)習(xí)者情感變化的規(guī)律,并將這些規(guī)律及時(shí)反饋給講授者,則有助于講授者判斷學(xué)習(xí)者對講授課程及講授方式所持有的情感傾向,從而調(diào)整授課內(nèi)容及方式,有效促進(jìn)E-learning的認(rèn)知深度,提高E-learning效果。 早在1997年,哈茲瓦斯羅和麥基翁就嘗試使用監(jiān)督學(xué)習(xí)方法(Hatzivassiloglou & McKeown,1997),對英文詞語進(jìn)行情感語義傾向性判別,2002年龐等(Pang & Lillian,2002)提出了文本情感分類(Sentiment Classification),并使用傳統(tǒng)的三種機(jī)器學(xué)習(xí)方法對電影評論按照“正面”和“負(fù)面”情感進(jìn)行分類。同年,特尼(Turney,2002)提出了基于情感種子詞與PMI的無監(jiān)督情感分類方法。2008年,第一屆中文傾向性分析評測會(huì)議(Chinese Opinion Analysis Evaluation)在北京召開,與會(huì)專家指出文本傾向性分析已成為自然語言處理的熱點(diǎn)。特征項(xiàng)選擇方式對分類算法效果有較大影響。王素格和朱嫣嵐等分別基于同義詞詞集和HowNet(《知網(wǎng)》)研究了中文詞匯的情感傾向(王素格,魏英杰,2008;朱嫣嵐等,2006),陳建美等(2009)通過語法特征提取,利用條件隨機(jī)場(Conditional Random Fields)自動(dòng)發(fā)現(xiàn)情感詞匯;王根等(2007)利用多重冗余標(biāo)記CRFs分析句子的情感傾向;樊娜等(2009)利用主題概念和CRF研究了主題情感句的分析與提??;夏云慶等(2010)提出情感向量空間模型,并研究了歌詞情感分類的應(yīng)用,聞彬等(2010)和姚天昉等(2008)分別研究了文本情感分類和文本意見挖掘;王洪偉等(2010)對Web文本情感分類的研究進(jìn)行了探討,將情感分類分為主客觀分類、極性判別和強(qiáng)度判別三類任務(wù),分析了情感分類中的語料庫選擇和研究難點(diǎn)。隨著情感分析技術(shù)的不斷成熟,目前許多大型公司都試圖應(yīng)用情感分析,挖掘用戶對產(chǎn)品的看法和意見,以此修改產(chǎn)品的相關(guān)設(shè)計(jì)或向用戶推薦符合個(gè)性需求的產(chǎn)品。例如,貝爾開發(fā)了產(chǎn)品評論意見挖掘系統(tǒng)(Bell & Federman,2013),通過對用戶評論的分析,統(tǒng)計(jì)用戶對產(chǎn)品的意見,并以友好方式呈現(xiàn),方便用戶選購時(shí)與其它產(chǎn)品進(jìn)行比較。 在教育領(lǐng)域,近年雖然出現(xiàn)了許多交互性E-learning平臺(tái),學(xué)習(xí)者可通過留言板、資源評論、課程評論、教師評論等提交評論,但這些評論信息卻沒有得到有效利用,主要原因在于評論信息太多,且正面與負(fù)面評價(jià)相互摻雜,難以分析學(xué)習(xí)者的看法。如何應(yīng)用情感分析從這些評論文本中挖掘?qū)W習(xí)者對教育資源和網(wǎng)絡(luò)課程的情感態(tài)度,對E-learning的發(fā)展意義重大。本文首先從技術(shù)層面概括了文本情感分析的一般過程原理和技術(shù),提出了情感分類在E-learning中的應(yīng)用模型,實(shí)現(xiàn)了評論文本情感分類引擎,并將其整合到“課程在線”中進(jìn)行應(yīng)用評價(jià)。本文為文本情感分析技術(shù)在教育中的研究與應(yīng)用跨出了第一步,希望能起拋磚引玉的作用。 二、文本情感分析及關(guān)鍵技術(shù) 情感分析有廣義和狹義之分。廣義情感分析包含分析文本中說話人的心理,狹義情感分析則主要判斷說話人關(guān)于某物或某事的觀點(diǎn)是“贊同”還是“反對”??梢姡M義的情感分類實(shí)際上是一種文本分類,其基本過程和技術(shù)與文本分類近似,涉及領(lǐng)域同樣包括人工智能、Web文本分類、文本挖掘、心理學(xué)等。與自動(dòng)文本分類不同的是,傳統(tǒng)的文本分類目標(biāo)是挖掘文本主題的歸屬,不涉及用戶情感的內(nèi)容。本文探討的文本情感分類,主要是分析并判別分類文本中所包含的各種用戶情感信息,如積極或消極、肯定或否定、喜愛或厭惡等。 (一)基本過程 文本情感分類技術(shù)是文本分類技術(shù)的一種新形式,基本過程和分類算法與文本分類大致相同(見圖1),主要區(qū)別在于特征提取階段。文本情感分類更注重情感特征的提取,而非主題特征的提取。 由圖1可以看出,文本情感分類過程依次經(jīng)過五個(gè)環(huán)節(jié): 1)收集數(shù)據(jù)。要分析用戶對某一事物的情感態(tài)度,首先需要收集用戶的評論信息。目前,用戶評論數(shù)據(jù)的來源主要有網(wǎng)站留言板、產(chǎn)品在線評論、產(chǎn)品論壇、新聞評論等。 2)預(yù)處理。為了減少干擾,提高情感分類的效率和準(zhǔn)確性,在特征提取和分類前需要對文本進(jìn)行預(yù)處理。根據(jù)不同的文本特性和算法要求,預(yù)處理需要完成不同的任務(wù)。對中文文本,預(yù)處理一般需要進(jìn)行中文分詞、詞性標(biāo)注、去停用詞等操作。 3)主觀句識(shí)別。對長文本,往往需要借助情感語義詞典識(shí)別文本主觀性句子,以在后期分類階段進(jìn)行情感判斷。對內(nèi)容較短的評論文本,一般不需要經(jīng)過主觀句識(shí)別。 4)情感特征提取。情感特征提取是文本情感分類與普通文本分類的最大區(qū)別。情感特征提取需提取反映用戶情感傾向的文本特征詞匯,如形容詞、否定詞等。而普通文本分類中提取的是反映文本內(nèi)容主題的特征詞匯,如關(guān)鍵詞、主題詞等。因此,普通文本分類使用的TF-DF、信息熵、互信息以及卡方檢驗(yàn)等特征提取算法在文本情感分類中無法直接使用。對于情感特征的提取目前主要通過情感語義詞典實(shí)現(xiàn)。 5)文本情感類別判斷。提取文本的情感特征后,要構(gòu)建情感模型,并使用常規(guī)文本分類算法完成文本情感類別分析,其主要分類算法有樸素貝葉斯、支持向量機(jī)(Support Vector Machine,SVM)等。目前對情感模型研究相對較少,一般將評論文本的情感分正面、負(fù)面和中性三類。當(dāng)然,研究者也可以通過表意非常明顯的特征直接進(jìn)行判斷。 (二)基于情感單元的情感特征提取 情感特征提取是文本情感分析的主要任務(wù)之一。情感語義詞典是情感特征提取的主要來源,算法將隱含在文本中,表示情感的詞匯提取出來形成情感特征詞,然后將文本表示為向量空間模型SVM,提交給Bayes或SVM分類器進(jìn)行情感分類。但是,以詞匯為特征的向量空間模型存在以下問題: 1)無法消除某些與情感表達(dá)無關(guān)的詞匯;2)很多情感詞匯存在歧義,SVM無法消除詞匯歧義;3)基于情感詞匯的SVM沒有考慮否定詞和修飾詞在情感表達(dá)中的重要作用;4)評論文本一般較短,基于情感詞匯的SVM中特征詞匯過多,容易導(dǎo)致產(chǎn)生數(shù)據(jù)稀疏的SVM。針對以上問題,清華大學(xué)夏云慶等(2010)提出“情感單元”概念,在定義對象的情感特征時(shí)將情感單元作為其單位元素,組織構(gòu)成相應(yīng)的向量空間模型。 基于情感單元的情感特征包括以下三部分(夏云慶等,2010): 1)情感詞典。它可形式化地描述為一個(gè)三元組L={C,N,M},C={ci},i=1,…,I;N={nj},j=1,…J;M={mt},t=1,…,T。其中C是情感詞集,每個(gè)情感詞都被賦予一個(gè)表示正面或負(fù)面極性強(qiáng)度的數(shù)值,正數(shù)表示正面情感,負(fù)數(shù)表示負(fù)面情感。N是否定詞集,M是修飾詞集,每個(gè)修飾詞用一個(gè)正數(shù)表示加強(qiáng)情感強(qiáng)度,用一個(gè)負(fù)數(shù)表示減弱情感強(qiáng)度。 2)情感單元。情感單元是在約定大小的上下文窗口中出現(xiàn)的情感詞、否定詞和修飾詞及其強(qiáng)度數(shù)值。它可形式化地表示為U={ci,nj,mt},ci表示窗口出現(xiàn)的情感詞及其對應(yīng)的極性強(qiáng)度,nj表示窗口出現(xiàn)的否定詞及其頻率,mt表示窗口出現(xiàn)的修飾詞及其修飾強(qiáng)度。 3)情感特征。根據(jù)情感單元定義和漢語情感表達(dá)習(xí)慣,可總結(jié)如下6組12種情感特征(見表一)。 基于情感單元的情感特征去掉與情感表達(dá)無關(guān)的詞匯,通過上下文窗口能在一定程度上消除歧義,還考慮了否定詞和修飾詞對情感表達(dá)的置反作用等,能較好地提高情感分類的準(zhǔn)確性。此外,只有12個(gè)情感特征,向量維度低,不僅可避免數(shù)據(jù)稀疏,還能提高情感分類計(jì)算的復(fù)雜度。 三、應(yīng)用模型 在Web2.0技術(shù)影響下,E-learning平臺(tái)中學(xué)習(xí)者、教師、管理者之間的交互變得容易、頻繁、便捷。除同步視頻、在線聊天等實(shí)時(shí)、同步交互方式外,留言板、教育資源評論、網(wǎng)絡(luò)課程評論等延時(shí)、異步交互方式也扮演重要角色。E-learning相對于傳統(tǒng)教學(xué)的最大優(yōu)點(diǎn)在于它使學(xué)習(xí)可以發(fā)生在任何時(shí)間、任何地點(diǎn)。從這個(gè)角度講,延時(shí)、異步的交互方式比實(shí)時(shí)、同步交互方式更具重要作用。目前,學(xué)習(xí)者通過留言板、教育資源評論、網(wǎng)絡(luò)課程評論發(fā)布的正面信息與負(fù)面信息相互夾雜,使教師和管理者無法從中挖掘?qū)W習(xí)者的真實(shí)需求,嚴(yán)重阻礙學(xué)習(xí)者與教師和管理者間的交互。情感分類通過對評論文本的語義分析,判斷評論者對某一事物的情感態(tài)度,為評論文本的情感分類開辟了新道路。 通過對現(xiàn)有E-learning平臺(tái)各模塊的分析可知,情感分類最直接、最簡單的應(yīng)用就是對留言板、教育資源評論和網(wǎng)絡(luò)課程評論發(fā)布的信息進(jìn)行情感判斷,并按照情感分類顯示給學(xué)習(xí)者、教師和管理者。具體應(yīng)用模型見圖2。 將E-learning的評論文本引入情感分類,從系統(tǒng)架構(gòu)的角度看,需要從三個(gè)部分作出調(diào)整,它們分別為:E-learning平臺(tái)、E-learning管理平臺(tái)和數(shù)據(jù)存儲(chǔ)。從用戶使用角度看,情感分類會(huì)給三類成員帶來新的使用體驗(yàn),他們是學(xué)習(xí)者、教師和系統(tǒng)管理員。 E-learning平臺(tái)的主要功能是供學(xué)習(xí)者瀏覽學(xué)習(xí)資源,學(xué)習(xí)網(wǎng)絡(luò)課程,與教師和其他學(xué)習(xí)者相互交流。引入情感分類后的E-learning平臺(tái)出現(xiàn)的最大區(qū)別在于:學(xué)習(xí)資源和網(wǎng)絡(luò)課程的評論信息按照情感極性分類顯示。學(xué)習(xí)者可較快了解某一學(xué)習(xí)資源或某門網(wǎng)絡(luò)課程的優(yōu)缺點(diǎn),選擇更加適合自己的學(xué)習(xí)資源和網(wǎng)絡(luò)課程。 為了實(shí)現(xiàn)評論信息按照情感極性分類顯示,我們在系統(tǒng)模型中作了兩點(diǎn)調(diào)整:1)在留言板、資源評論和網(wǎng)絡(luò)課程評論中引入情感分類引擎,用于判斷評論信息的情感極性;2)在評論信息數(shù)據(jù)存儲(chǔ)中加入“情感極性”字段,用于存儲(chǔ)評論信息的情感類別和情感強(qiáng)度;3)在向?qū)W習(xí)者展示評論信息時(shí),需要讀取數(shù)據(jù)存儲(chǔ)中保存的情感極性和強(qiáng)度,按照情感類別分組和按照情感強(qiáng)度排序顯示。 E-learning教學(xué)管理平臺(tái)的主要功能是讓教師上傳、發(fā)布和管理教學(xué)資源,遠(yuǎn)距離實(shí)時(shí)授課,布置學(xué)習(xí)任務(wù),查看學(xué)習(xí)者留言并與學(xué)習(xí)者交流。引入情感分類后的教學(xué)管理平臺(tái)將使教師和管理者產(chǎn)生新的使用體驗(yàn):他們面對的不再是混雜、海量的評論信息,而是一份正面評論與負(fù)面評論的統(tǒng)計(jì)報(bào)告,外加一段簡短的建議。要實(shí)現(xiàn)這種新的使用體驗(yàn),教學(xué)管理平臺(tái)需作如下調(diào)整:1)從數(shù)據(jù)存儲(chǔ)中讀取評論信息的情感類別和強(qiáng)度,并進(jìn)行簡單的統(tǒng)計(jì),如正面、負(fù)面評論的條數(shù);2)對同類評論信息利用數(shù)據(jù)挖掘技術(shù),發(fā)現(xiàn)評論的關(guān)鍵對象或?qū)傩?,并生成意見摘要?/p> 通過對上述應(yīng)用模型的分析可知,對評論文本引入情感分類后具有如下特征:1)學(xué)習(xí)者通過分類顯示的評論信息,可更清晰、快捷地發(fā)現(xiàn)優(yōu)質(zhì)的學(xué)習(xí)資源,選擇適合自己學(xué)習(xí)風(fēng)格的網(wǎng)絡(luò)課程;2)教師和管理人員通過評論信息統(tǒng)計(jì)報(bào)告和建議摘要,能夠制作滿足學(xué)習(xí)者需要的優(yōu)質(zhì)教學(xué)資源,解決教學(xué)問題,提高教學(xué)能力;3)通過對學(xué)習(xí)者評論信息的挖掘,發(fā)現(xiàn)學(xué)習(xí)者的學(xué)習(xí)風(fēng)格等特質(zhì),提供個(gè)性化服務(wù)。 四、情感分類系統(tǒng)的實(shí)現(xiàn) 長沙學(xué)院“課程在線”是典型的E-learning系統(tǒng),主要用于輔助課堂教學(xué)或網(wǎng)絡(luò)教學(xué)。教師可通過“課程在線”建設(shè)網(wǎng)絡(luò)課程,包括課程大綱、講義、課堂視頻和其它擴(kuò)展性學(xué)習(xí)資源,供學(xué)生下載;學(xué)習(xí)者可選修自己感興趣的課程,通過審核后便可進(jìn)入“課程在線”平臺(tái)瀏覽課程視頻,下載相關(guān)學(xué)習(xí)資源,與其他學(xué)習(xí)者和教師討論交流。學(xué)習(xí)者還可通過留言板、學(xué)習(xí)資源評論和課程評論三模塊發(fā)表評論信息。根據(jù)E-Learning評論文本的情感分類應(yīng)用模型,我們在三個(gè)評論模塊中引入情感分類技術(shù),將評論信息按照情感極性分為正面評論、負(fù)面評論、中性評論,并統(tǒng)計(jì)每個(gè)類別評論的數(shù)量。 實(shí)現(xiàn)“課程在線”中評論文本的情感分類系統(tǒng),關(guān)鍵在于情感分類引擎的實(shí)現(xiàn)。通過對情感分類基本過程及關(guān)鍵技術(shù)的研究,情感分類引擎中關(guān)鍵模塊的技術(shù)實(shí)現(xiàn)如下: 1)預(yù)處理。主要工作包括:中文分詞、詞性標(biāo)注、去停用詞。ICTCLAS是目前最成熟且綜合性能最優(yōu)的中文分詞軟件之一,可實(shí)現(xiàn)中文分詞和詞性標(biāo)注。各種詞典數(shù)據(jù)壓縮后不到3M,且支持用戶自定義詞典。本文中使用的停用詞表在原有基礎(chǔ)上除去了形容詞、副詞和動(dòng)詞。 2)相關(guān)詞典。本研究采用表一的12個(gè)情感單元作為情感特征,系統(tǒng)的情感分類引擎實(shí)現(xiàn)需要三類詞典:情感詞典、否定詞詞典、修飾詞詞典。本文使用HowNet在2007年發(fā)布的“情感分析用詞語集”(董振東等,2007)中的中文評價(jià)和情感詞語作為情感詞典,使用中文的程度級別詞語作為修飾詞詞典。否定詞詞典由人工從HowNet中抽取22個(gè)否定副詞組成。 3)情感特征提取。情感特征提取的關(guān)鍵是從預(yù)處理后的句子中找出情感詞,然后在一定的窗口大小中找出情感詞的修飾詞和否定詞。本文通過對情感詞典中所有情感詞的詞性統(tǒng)計(jì),得出情感詞的詞性主要為名詞、動(dòng)詞、形容詞,因而本文將選取文本中名詞、動(dòng)詞和形容詞作為主要候選匹配詞,并采用二叉樹形式存儲(chǔ)情感詞典,以提高情感特征詞的匹配效率。如果匹配成功,再根據(jù)夏云慶提出的五條抽取規(guī)則(夏云慶等,2010),以七個(gè)詞語作為窗口大小,抽取情感詞的修飾詞和否定詞。根據(jù)情感詞極性,修飾詞和否定詞數(shù)量,計(jì)算評論文本中每個(gè)情感單元的權(quán)值,形成情感向量空間模型。 4)情感分類器。在情感分類階段,本研究選擇性能較好的SVM分類算法,采用LibSVM工具實(shí)現(xiàn)。臺(tái)灣大學(xué)開發(fā)的支持SVM的機(jī)器學(xué)習(xí)開源軟件,能實(shí)現(xiàn)數(shù)據(jù)分類及回歸分析功能,且靈活易擴(kuò)展,應(yīng)用非常廣泛。 五、實(shí)驗(yàn)結(jié)果及分析 為了驗(yàn)證一般情感分類方法對E-learning評論文本進(jìn)行情感分類的有效性,以及情感分類對E-learning的促進(jìn)作用,本文從兩方面進(jìn)行實(shí)驗(yàn):一是情感分類的準(zhǔn)確性;二是學(xué)習(xí)者、教師和管理員在使用情感分類后的評價(jià)。 (1)情感分類準(zhǔn)確性 目前,情感分類方法的準(zhǔn)確性主要采用準(zhǔn)確率評價(jià)。準(zhǔn)確率指對一個(gè)測試集進(jìn)行情感分類后,分類正確的文本數(shù)量占測試集文本總數(shù)的百分比。為了計(jì)算基于情感單元和SVM的情感分類方法對評論文本分類的準(zhǔn)確率,首先需要構(gòu)建評論文本情感分類語料庫。本文從“課程在線”平臺(tái)的留言板、資源評論和課程評論三部分的評論文本中選擇450條評論作為實(shí)驗(yàn)語料,對挑選的語料進(jìn)行人工情感極性判斷,人工分類后的語料(見表二)。 實(shí)驗(yàn)采用LibSVM默認(rèn)的參數(shù)配置,選取每種語料類型的2/3作為訓(xùn)練集,將其余的1/3作為測試集。 學(xué)習(xí)者、教師和系統(tǒng)管理員是E-learning平臺(tái)的直接使用者,對情感分類的引入有切身體驗(yàn)。為了了解他們對情感分類的使用感受,本研究隨機(jī)抽取“課程在線”的42名教師、72名學(xué)生和12名管理員作為調(diào)查樣本,讓他們對情感分類功能打分,打分范圍為0~10。0~4分代表負(fù)面(不準(zhǔn)確),5~7分代表中性(基本準(zhǔn)確),8~10分代表正面(準(zhǔn)確),統(tǒng)計(jì)結(jié)果見表三。 由實(shí)驗(yàn)結(jié)果可以看出,基于情感單元和SVM的情感分類方法基本可滿足E-learning評論文本情感分類的要求,平均準(zhǔn)確率在80%以上。但是,相對于一般的產(chǎn)品評論情感分類,E-learning評論文本的情感分類準(zhǔn)確率明顯略低。這也從另外一方面證明E-learning評論文本在情感表達(dá)上有自身的特點(diǎn),研究針對E-learning中評論文本的情感分類方法是必要的。 (2)實(shí)用性評價(jià) 本研究還讓使用者進(jìn)行實(shí)用性評價(jià),打分范圍為0~10。0~2分代表“不實(shí)用”,3~4分代表“實(shí)用性較差”,5~6分代表“較實(shí)用”,7~8分代表“很實(shí)用”,9~10分代表“非常實(shí)用”,結(jié)果見表四。 由實(shí)驗(yàn)結(jié)果可看出,所有學(xué)習(xí)者、教師和管理員都肯定情感分類在E-learning中的實(shí)用性。82.15%的受訪者認(rèn)為非常實(shí)用或很實(shí)用。由此可見,情感分類的引入有效地提高了E-learning平臺(tái)的可用性。 六、結(jié)語 用戶在互聯(lián)網(wǎng)上發(fā)布信息直接或間接地表達(dá)他們對事物的情感態(tài)度,從中挖掘他們的情感態(tài)度意義重要。在E-learning平臺(tái)中,從學(xué)習(xí)者的評論文本或Blog中挖掘?qū)W習(xí)者對網(wǎng)絡(luò)課程、學(xué)習(xí)資源和教學(xué)平臺(tái)的情感態(tài)度,對促進(jìn)E-learning發(fā)展作用重大。本文首先歸納了文本情感分類的五個(gè)步驟:數(shù)據(jù)收集、文本預(yù)處理、評價(jià)主觀句識(shí)別、提取文本情感特征詞匯以及分析并判讀文本所屬情感類別,指出情感特征提取是文本情感分析與普通文本分類的主要區(qū)別,也是文本情感分類的關(guān)鍵技術(shù)。目前以詞匯為特征的向量空間模型存在一定問題,宜選用以情感單元為情感特征單位,構(gòu)建情感向量空間模型,并將其引入具體課程在線論壇的情感文本分類引擎,完成預(yù)處理、創(chuàng)建詞典、提取情感特征及最后分類等工作。實(shí)驗(yàn)表明,基于情感單元和SVM的情感分類方法基本可以滿足E-learning評論文本情感分類的要求,平均準(zhǔn)確率在80%以上;學(xué)習(xí)者、教師和管理員肯定了情感分類在E-learning中的實(shí)用性。由此可見,情感分類的引入有效地改進(jìn)了E-learning平臺(tái)的可用性。但是,文本情感分析技術(shù)在E-Learning中的應(yīng)用遠(yuǎn)不止于此,還需進(jìn)一步研究。此外,情感表達(dá)的復(fù)雜性與情感模型的科學(xué)性,提取更合適的情感特征,提高情感分類的準(zhǔn)確率等,這些都期待開展更深入的研究。 [基金項(xiàng)目]湖南省普通高等學(xué)校教學(xué)改革研究項(xiàng)目“構(gòu)建有效激勵(lì)體系,促進(jìn)軟件工程專業(yè)實(shí)踐教育創(chuàng)新”(411)成果之一。 [作者簡介]潘怡,博士,長沙學(xué)院計(jì)算機(jī)學(xué)院副教授(panyi@ccsu.cn);葉輝(通訊作者),博士,長沙學(xué)院計(jì)算機(jī)學(xué)院講師;鄒軍華,博士,湖北大學(xué)教育學(xué)院副教授。 轉(zhuǎn)載自:《開放教育研究》雜志 2014年4月第21卷第2期 排版、插圖來自公眾號:MOOC(微信號:openonline)
|
|