1 關(guān)鍵詞的涵義。 關(guān)鍵詞(keyword)是直接從文獻的題名、正文或文摘中抽取出來出的具有檢索意義的語詞。關(guān)鍵詞是主題詞的一種。主題詞有廣義和狹義之分,廣義的主題詞包括標題詞、元詞、敘詞和關(guān)鍵詞,狹義的主題詞專指敘詞。關(guān)鍵詞索引語言是一種未經(jīng)選優(yōu)和規(guī)范化的自然語言,標題詞、元詞、敘詞索引語言都屬于受控語言,關(guān)鍵詞索引語言與主題法其它索引語言(標題語言、元詞語言、敘詞語言)的主要區(qū)別即在于此。 在檢索語言中,所謂規(guī)范化處理主要指詞類、詞形(如英語中的單復數(shù),漢語中漢字的簡體字、繁體字、異體字)和詞義(如同義詞、近義詞、多義詞)的規(guī)范。比如,同義詞“計算機”和“電腦”、“激光”和“萊塞”,經(jīng)過規(guī)范化處理后是以選擇“計算機”、“激光”作為正式主題詞。由于關(guān)鍵詞不要求在詞義、詞形上做嚴格的規(guī)范化處理,因此沒有可供參照的詞表,選取時比較容易,只要能表達文獻的主題,除停用詞表(stop-list)以外的詞都可選作關(guān)鍵詞。而其它的主題詞則要經(jīng)過嚴格的規(guī)范化處理,并都有詞表(如(漢語主題詞表))可供參考,選取時不僅要表達文獻主題,而且要查對詞表,看是不是詞表中經(jīng)過規(guī)范化處理的正式主題詞。由此可見,關(guān)鍵詞的選取比其它類型的主題詞方便得多,標引效率較高。 關(guān)鍵詞的涵義國內(nèi)學術(shù)界說法很多,主要分歧體現(xiàn)在關(guān)鍵詞與主題詞的關(guān)系上,試分述如下: 1.1 等同關(guān)系。 認為確定文章的關(guān)鍵詞要選用《漢語主題詞表》中的正式敘詞(主題詞),這種觀點將屬于規(guī)范化語言的敘詞(主題詞)與屬于自然語言的關(guān)鍵詞混為一談,是對關(guān)鍵詞基本概念的誤解,會使關(guān)鍵詞的標引者無所適從。 1.2 整體與部分的關(guān)系。 認為關(guān)鍵詞由敘詞和自由詞(應為關(guān)鍵詞)組成。敘詞和關(guān)鍵詞同屬主題法系統(tǒng),都是用語詞作為檢索標識。在關(guān)鍵詞的標引過程中,有些詞就是敘詞表中的正式敘詞,但在關(guān)鍵詞索引語言中只能把它當作關(guān)鍵詞來看待。關(guān)鍵詞由敘詞和自由詞組成的提法是不妥的。 1.3 屬種關(guān)系。 認為主題詞由標題詞、元詞、敘詞和關(guān)鍵詞組成,主題詞和關(guān)鍵詞是屬種關(guān)系。 1.4 并列關(guān)系。 認為主題詞和敘詞是同一概念,與關(guān)鍵詞是并列關(guān)系。筆者認為,以上(1)、(2)兩種觀點與關(guān)鍵詞的基本概念不能吻合;(3)、(4)兩種觀點的分歧在于對主題詞概念的理解,狹義的主題詞(敘詞)與關(guān)鍵詞是并列關(guān)系,廣義的主題詞與關(guān)鍵詞是屬種關(guān)系。 2 關(guān)鍵詞的選詞。 關(guān)鍵詞雖然不需要嚴格的詞義和詞形上的規(guī)范化處理,但關(guān)鍵詞的選取要力求做到:簡煉地使用關(guān)鍵詞---不濫選;正確揭示主題---不錯選;全面反映主題---不漏選。同時關(guān)鍵詞選取的范圍以及關(guān)鍵詞的詞類等方面都有一定的要求。 2.1 關(guān)鍵詞選詞的方法。 2.1.1 抽詞法。 就是從題名或者文摘和全文中直接抽取關(guān)鍵詞。如從題名《關(guān)于圖書館信息服務(wù)網(wǎng)絡(luò)化的思考》中直接抽取“圖書館”、“信息服務(wù)”、`網(wǎng)絡(luò)化‘等作為關(guān)鍵詞。 2.1.2 賦詞法。 就是依據(jù)文獻題名、文摘或全文進行主題分析,憑藉標引人員的智慧并參照有關(guān)工具書,人為地提煉出能夠表達主題概念的關(guān)鍵詞,如標引“普通化學教學改革的研究與實踐”這個主題概念,給出“普通化學”、“教學改革”、“高等教育”、“課程設(shè)置”、“第二課堂”、“化學教學”、“實驗教學”、“教學方法”等關(guān)鍵詞。 2.2 關(guān)鍵詞詞類的選擇。 關(guān)鍵詞主要選擇概念明確、含義清楚的名詞和名詞性詞組;冠詞、介詞、連詞、助動詞、某些形容詞不選作關(guān)鍵詞;沒有檢索意義的通用詞(如分析、影響、發(fā)展、研究、探討、應用、評價、建議、問題等)一般也不選作關(guān)鍵詞。比如, “應用現(xiàn)代教育技術(shù)優(yōu)化物理課堂教學”一文,可選取“物理教學”、“課堂教學”、“現(xiàn)代教育技術(shù)”作為關(guān)鍵詞, “應用”一詞沒有檢索意義,故不選作關(guān)鍵詞。再如,“電子出版物對信息傳播模式的影響”一文,可選取“電子出版物”、“信息傳播模式”、“圖書館”作為關(guān)鍵詞。“傳播”雖然是動詞,但“信息傳播模式”是名詞性詞組,故可以選作關(guān)鍵詞。 一些表示時間概念的詞不能單獨作為關(guān)鍵詞,如“古代”、“現(xiàn)代”、“建國初期”、“新時期”、“轉(zhuǎn)型期”、“21世紀”等。凡是如人名、地名、事物名稱等簡短單一的名詞,就可直接把它作為一個關(guān)鍵詞,如“毛澤東”、“上?!薄ⅰ包S河”、“人民日報”、“生物學”、“西安事變”等。 3 復合詞組的切分與保留。 3.1 一個復合詞組由“整體與局部”兩個關(guān)鍵詞構(gòu)成時,可切分為兩個詞,如“汽車發(fā)動機”切分為“汽車”、“發(fā)動機”兩個詞。 3.2 一個復合詞組由概念交叉的兩個關(guān)鍵詞構(gòu)成時,切分為兩個詞。如“起重運輸機”切分為“起重機”、“運輸機”兩個關(guān)鍵詞。切分概念交叉的復合詞組時,要按概念切分,不能按字面切分,如“小兒肺炎”可以切分為“小兒疾病”、“肺炎”兩個關(guān)鍵詞。 3.3 一個復合詞組被切分后,產(chǎn)生歧義時,應保留復合詞組作為一個關(guān)鍵詞。如“黑色金屬”,不能再切分成“黑色”和“金屬”. 3.4 固定搭配且具有特定含義的詞組和科技術(shù)語,不宜拆分開來,而應以詞組和科技術(shù)語作為關(guān)鍵詞。這樣不僅可以減少關(guān)鍵詞的數(shù)量,而且能更好地表達文獻的主題,不致產(chǎn)生詞義上的理解誤差。比如,“網(wǎng)絡(luò)環(huán)境下圖書館信息資源建設(shè)”一文,可選取“信息資源建設(shè)”、“圖書館”、“網(wǎng)絡(luò)環(huán)境”作為關(guān)鍵詞,但不宜將“信息資源建設(shè)”拆分為“信息資源”和“建設(shè)”,因為“信息資源建設(shè)”表達的是一個特定的概念,而“建設(shè)”無檢索意義。 由上述可見,關(guān)鍵詞雖然不是嚴格規(guī)范化的主題詞,但也必須按照一定的規(guī)則去選詞,只有這樣,才能通過有限的幾個詞來準確、充分、簡煉地揭示出文章的主題,提高主題標引的質(zhì)量和文獻檢索的效果。 |
|