Aug 7, 2007

近代漢語斷詞手冊

 

前言

體裁問題(文言、詩詞歌賦)

如果某些動詞的使成用法在現代漢語中不再具有創生力時,即視為及物動詞,不再視為兼具及物與不及物用法的「作格動詞」(ergative verb)。只是這些特殊用法必須視為文言的遺留,和現代漢語中保有創生力的作格動詞不同。

有些副詞是文言的遺留,其搭配的動詞或副詞很有限制,因此會使人覺得應該和其他語素被合為一詞,不過

體裁問題(其他:成語諺語)

壹、一般分詞原則

1.單字詞自為一個分詞單位。

2.多字而為單語素的自為一個分詞單位,因此連綿詞、音譯詞自為一個分詞單位。

3.疊字詞若非可由構詞律產生者,則自為一個分詞單位。但AABB式若由AB式產生者,仍標為一個分詞單位。

4.無論何種複合結構,若是超過四個音節的,只要能再切分,原則上給與切分。也就是一個字組如果在意義上雖為一體而還不是不可分的整體,如果音節過長,還是儘可能拆分。但成語諺語不受此原則限制。

5.一個字組若是由構詞律組合者切分之。

5.專名原則上自為一個分詞單位。

6.語素(字)的組合產生的意義不只是字義單純累加的(意即意義經過轉化或重構的)合併選為一個分詞單位(以下就以「轉義」來簡稱意義的轉化或重構)。

?7.離心結構合併為一詞。

8.附著語素依以下標準來決定是否獨立為詞:

(1).虛字為附著語素,依所附著的成分來決定是否獨立為詞。傳統上列為虛詞的副詞(這裏的副詞並不包括名詞、動詞作狀語的)、介詞、連詞、助詞等儘管為附著語素,但都依附於詞組上,故原則上獨立為詞。指代詞介於虛實之間,但通常獨自分為一詞(參第8條)。

(2).其他的虛字依其附著情況又大可分為兩類,是否獨立為詞也依此分類而定。附著語素如果只附著於別的詞,不依附於詞組上,則和其他的詞合併為一個分詞單位(如「刀子」「忽然」)。如果附著語素雖然常附著於詞,但也可以附著於詞組,則該語素獨自視為一個詞(如「兄弟們」的「們」)。所以如果某語素同時也可以附著於詞組上,該語素就當作一個詞看。但當這個附著語素只和一個封閉類的詞相結合時,則合併為一個分詞單位(如代詞是個封閉類,因此「他們」視為一詞)。如果附著語素可以附著於詞和詞組,但能和該語素結合的詞已限定為少數幾個(也就是差不多失去衍生力了),則該語素和相結合的詞合併為一個分詞單位(例如「者」為一個詞,但「賢者」還是合併為一個分詞單位),和詞組結合的則該語素和詞組各自分為一個分詞單位。

(3).附著語素如果固定和某個無窮類的詞相結合而且負擔意義恒為不變的話,一律獨自視為一個分詞單位。例如:「第一」的「第」總是搭配數字,數字是無窮類,因此「第」獨自分為一個詞。但如「第一義」之類有佛學意義,則合併為一個分詞單位。

(4).近代漢語實字是否為自由語素並不易判斷。目前暫時把不能作名語的名詞和不作述語的動詞視為附著語素。近代漢語實字如為附著語素,通常只依附於其他語素(包括自由語素和附著語素),這個實字和其他語素合併為一個分詞單位。

9.因為近代漢語實字是否為自由語素並不易判斷,我們也從其結合面的廣狹來幫忙決定是否算是個分詞單位(也就是視常用性或所搭配的語素多寡而定)。

結合面廣泛的語素除非在結合其他語素後造成轉義或者十分常用,否則原則上獨自視為一個分詞單位,虛詞可不用說,其他如指代詞、數詞原則上獨自視為一個分詞單位。其中數詞即使是幾個數字共同組成一個數目,其中每個數字都各自分成一個分詞單位。但指代詞、數詞也有和其他詞合併為一個分詞單位的,特別是在偏正結構中。方位詞的結合面也廣,但在偏正結構中,方位詞與他詞的結合的緊密度,似乎依其地位而有所差別,所以是否獨立分詞,難以一概言之。

指代詞、數詞、方位詞在偏正結構中分詞與否的條件比較複雜,其施行細則見下文的貳之七。

其他實字也有結合面廣的,則以結合後有轉義的或語素搭配固定的為詞,否則各成分分別為詞。

10.實字搭配後為高頻率及共現率高的儘可能的合併為一個分詞單位。

11.離合詞或不連續的詞語原則上分詞,但可加上語法特徵來加以連繫。

12.根據以上標準而分合還猶豫難決的,暫時仍合標為一個分詞單位。

13.成語、諺語原則上合為一個分詞單位,但標上獨有的類別,以示非一般的詞。如果中間有標點符號隔開,可用語法特徵來連繫。

14.為了比較之便,原則上,除了本手冊已有規則要分詞之外,現代漢語的詞我們也合併為一個分詞單位(衡量現代漢語是否為詞的標準大體依據中研院詞庫小組的電子詞典,但其中也有相異之處,主要的異同可參考第參節)。

貳、各結構類的選詞標準

因無現成的近代漢語詞庫,所以我們要利用在文檔上斷詞和加詞類標記的時候,來建立這樣的一個詞庫。但要建立近代漢語的詞庫,就得避免把不該列在詞典中的詞語列進我們的詞庫中,在進行分詞時就不得不放棄用現代漢語組的構詞律來合詞,因此有些在現代漢語組該合併的詞語在近代漢語組就不得不分(參第參節)。

一個漢字若正好是一個詞,自不用說應為一個分詞單位。兩個字以上的組合則有可能是詞或詞組,以下的選詞標準主要是針對兩個字以上的詞或詞組。

語素合併選為一個分詞單位的理由不外乎語素不獨自作述語或名語、語素合併後意義有所轉化、語素搭配固定、使用頻率高、音節不太多等等。

我們對近代漢語詞的分合可以按以下幾類來加以說明:

1.專名、2.連綿詞、3.音譯詞、4.重疊詞、5.派生詞與附屬詞、6.並列結構、7.偏正結構、8.述補結構、9.述賓結構、10.介賓結構、11.主謂結構、12.縮寫或節略、13.成語諺語、14.其他。

一、專名

1.專名不論語素多寡,一律不作切分,獨自作為一個分詞單位。

2.各書篇卷開頭的標題、作者不作標選。

3.專名與通名連用而又同位時(「專名+通名」,其中專名為人名、地名),合併為一個分詞單位。如。.

4.因為本標準把連用的專名與通名合併為一個分詞單位,因此造成專名與偏正結構區辨上的問題。

當專名又以通名為其中心語時(其實只限於同位的情況),有兩種可能的選詞法。其一為選專名,其一為選偏正結構。

二、連綿詞

連綿詞包括雙聲疊韻詞與非雙聲疊韻詞(這些詞大體來自上古,因此是否雙聲或疊韻本應以上古漢語音系為準,而不能依賴近代漢語語音),是不能分解的單純詞(如「恍惚」「珊瑚」),所含各字皆非語素,也就是說每個字分開後獨自沒有意義。就不能分解這一點言,連綿詞性質類似下述的音譯詞。只是連綿詞限於二字,而且大體是上古漢語本有的詞或早期的外來詞;而音譯詞不限字數。

在斷詞時,連綿詞不切分,獨自作為一個分詞單位。

三、音譯詞

指外來語直接音譯為漢字而又非專名的。

音譯詞不切分,獨自作為一個分詞單位。如「菩薩」「菩提」等。

四、重疊詞

(一)分合原則:

1.不是由重疊律產生的重疊形式列為一個分詞單位。

2.描繪情狀的AA式重疊形式不易判定是否由重疊律產生,其中有些可能不用或不常用不重疊的形式了,因此我們把這樣的重疊形式列為一個分詞單位。表示程度加強的AA式事實上和描繪情狀的連綿詞性質相類,語法表現也相類。由AB產生的AABB基本上也是描繪情狀的,雖然其中的AB仍為常用的詞,由於不能直接切分,為了斷詞切分的方便,仍列為一個分詞單位。另外能夠重疊為AABB的ab也有限制,似乎和詞彙不無關係,因為語義相當的並不一定有平行的重疊形式。比較「漂漂亮亮」和「?美美麗麗」。

3.由重疊律產生的重疊形式若只是傳達特定的語法意義,不列為一個分詞單位。如表示嘗試或暫時貌、逐指等。

4.不能直接切分的重疊形式列為一個分詞單位(如「明明白白」);不連續的重疊分詞(如「試一試」)。

(二)分合實例:

以下按疊字的形式來說明分詞的處理情形:

1.疊字詞最多的是AA式,也就兩個相同的字的重疊。AA式有三種:

(1).AA或是不能拆的疊音詞,或是重疊表示程度上的加強。如「青青」「了了」「輕輕」「奶奶」。合為一個分詞單位。

(2).AA是A的重疊,表示逐指:這一類的重疊,有普通名詞或量詞的重疊(如「人人」「色色」「一片片」)、時間詞的重疊(如「世世」)、副詞的重疊(如「各各」)等。其中只有副詞的重疊合為一個分詞單位,因為副詞可以重疊的很有限。

(3) AA是動詞的重疊,表示嘗試或暫時貌。如「試試」。分為不同的詞。

這三類AA式性質是很不相同的。第一種疊音詞事實上和連綿詞性質相類,只不過AA式是否全部都不是A的重疊,尚無定論。

2.AAB:主要為動詞的重疊。如「見見面」。如果其中的AB為動賓複合詞的時候,在分詞上比較不好處理。如「見見面」的「見面」仍分標為二詞,再加上指示其為複合詞的語法特徵,第一個「見」或許可比照第二個「見」的標示法。

3.ABB:「赤條條」視如描繪情狀的AA式,合為一個分詞單位;「一次次」比照量詞的重疊,拆開來;「唱看看」的「看看」為嘗試貌的詞,獨自立為一詞。

4.AABB:AABB 如果不是AA和BB的單純並列,而是AB的重疊時,就合選為一個分詞單位。有時AABB不像是AB的重疊,也不像AA和BB的相加,也合選為為一個分詞單位。如「戰戰競競」。

當AABB是AB的重疊的時候,通常是表示情狀,都合選為為一個分詞單位。如「歡歡喜喜」「打打殺殺」。

5.ABAB:主要是AB式動詞的重疊,表示嘗試或暫時貌。可以用構詞律產生,因此分為不同的詞。如「走動走動」分為「走動 走動」。

6.A裏AB:「糊裏糊塗」。雖主要由AB式狀態動詞衍生,但只限於少數動詞,因此合選為為一個分詞單位。

7.「AXA」式:因為重疊的語素是不連續的,所以分為不同的詞。如「試一試」「試他一試」「試一試這個」「數了一數」。

五、派生詞與附屬詞

我們這裏討論的詞頭、詞尾只包括具有衍生性的虛語素。

有時實語素搭配的是詞綴或是附屬詞並不易斷定。

(一)詞頭與前加附屬詞

詞頭如「阿母」的「阿」、「兀那」的「兀」和其所附著的語素合選為一個分詞單位。

「阿」「老」有接在姓名前的,如「阿嬌」「老王」。也是和其所附著的語素合選為一個分詞單位,列入專名中,但需加上構詞成分的語法特徵。

「自」「相」「可」雖然負擔的語法意義固定,但一般直接在單音節的動詞前,且所搭配的動詞趨於固定,因此原則上與單音節動詞合詞。至於在雙音節動詞前的「自」「相」「可」就獨立為一詞,歸類為副詞,列入偏正結構中處理。「自」「相」「可」與單音節動詞搭配的也有不合詞的。一般原則是:「自」有反身作用的合詞;表示自主的如果跟的是及物動詞,則視此及物動詞後頭可否加賓語而定,可加賓語的不合詞,如「自 主 之」的「自」獨自為詞(但如「自主」的「自」是兼表示反身的仍合詞);「自」搭配不及物動詞的皆合詞,如「自然」。「可」加動詞後如果還跟了賓語的一般要分詞,否則合詞。如「可愛」「可 殺 之」。「相」與單音節動詞的搭配一律合詞。如「相打」「相罵」「相信」。

「第」雖然只搭配數詞,但數詞是無限的,且「第」在組合上永遠負擔固定的意義,我們可以視為附屬詞,把它獨立分為一詞。只有在某些意義特定的固定組合上合詞,如佛學語彙「第一義」。

(二)詞尾與後綴附屬詞

詞尾通常和其所附著的語素合選為一個分詞單位。如「子」「兒」在近代漢語可以確定為詞尾,因此「子」「兒」和其所附著的語素合選為一個分詞單位。

「王氏」「王某」的「氏」「某」和其所附著的語素合選為一個分詞單位,列入專名中,但需加上構詞成分的語法特徵。

動詞詞尾是一般所謂的構詞詞綴,表達特定的語法功能,且可搭配的詞多,因此就獨立分為一詞。如「了」「著」「過」「看」「看看」「將」。其中「將」一般放在移動動詞後趨向動詞前。

除了傳統所謂的語氣助詞以外,有些語素可附於詞和詞組之後,我們原則上都歸之附屬詞(語氣助詞也算是附屬詞,只是附著於句子。另外方位詞也算是後接的附屬詞,而副詞、介詞、連詞也可算是前接的附屬詞,但因都已歸於傳統的詞類,可以不論)。除了在某些條件下我們把它和其前的語素合併為詞以外,附屬詞通常獨自分為一詞。大約可分如下幾類:

1.位在名詞或名詞組之後,表示複數的:如「們」「等」「等等」「之類」等。這一類如果位在一般名詞後就獨立為詞,在代詞後則合併為一個分詞單位(如「我們」「我等」)。

2.位在數詞之後的:如表約數或餘數的「來」「餘」「多」。我們把數字的組合也當作詞組,因此這幾個語素也視為附屬詞,獨立為詞。如「五百來個」。

3.附綴於狀詞或有狀詞性質的詞組後: 如「地(的)」「裏」「價」「也似」「似的」「一樣」「一般」等。這一類原則上獨為一詞,在某些條件下把它和其前的語素合併為詞。另外,「然」在功能和歷史演變上和這些詞有關,但因為是由文言傳承而來,且搭配的語素趨於固化,因此視為詞尾,和其前的語素合併為詞。

4.可附在從句或狀語後,表示條件、時間、原因等的:「時」「(的)時節」「的時候兒」「的話」「上」「起見」「來」「以來」。原則上都獨立為詞。如「若是死時,與你們同死」「他去腰裏摸時,搭膊和書都不見了」「為此上」「九歲上」「十年來」。

5.「的(底)」「之」:附綴於定語後。不過「的(底)」後的中心語可以隱含,而「之」後面一定得有中心語名詞。

6.「得(的)」:表示可能性的動詞後綴,或作為引介補語的連接詞。如「曉得」(比較「曉不得」)「打得著」「娶得他起」「吃得口滑」。

7.「者」「所」:「者」「所」可分析為代詞性的附屬詞。除了部分附著在單字詞後的「者」與其所附著的詞合列為詞外,「者」原則上獨立為詞。「所」除了在表示全量的「所有」以外,都獨立為一詞。

「者」所附著的如果是單字的狀態動詞,則合併為一個分詞單位(如「仁者」「尊者」「長者」);如果是單字的動作動詞或數詞,則和所附著的分為二詞(如「施者」「受者」「二者」)。如果「者」和所附著的單字構成常用詞語,也合併為一個分詞單位(如「向者」「今者」)。「者」字如果只是助頓用的,則獨自分為一詞。

「然」「地(的)」「裏」「地裏」「價」「假」「家」「箇(個)」「生」「也似」「似的」「一樣」「一般」的分詞,我們認為需要再討論一下。這些語素,其功能大扺相類,但在分詞的處理上,似乎不必完全一致。所以有的我們列入詞尾,有的列入附屬詞。目前的處理是:詞尾都和所附著的語素合併在一起,附屬詞獨立分為一詞。以下稍作討論:

如「然」「爾」「如」等應視為詞尾,因為是由文言傳承而來且與其搭配的語素趨於固定化。例如「忽然」。

「地」通常跟在AA或ABB、AABB式的狀詞後頭,跟在單音節的詞後頭很少,另外更少見的是看來像是複合詞或詞組的(如「平白地」「不住地」「恭意加敬地」「不知不覺地」)。也有似不能分離的雙音節或三音節詞(如「猛可地」「軟郎當地」),亦為罕見。明代以後,用「的」來替代「地」逐漸常見起來。以下不特別指出時,就以「地」包括「的」。

和「地(的)」相結合的如果是單音節的語素,宜合併視為一詞。有些單音節的語素似乎不能不加「地」,或者得加「地」才能修飾更多的動詞。如「魆地」「特地」。「怎地」「恁地」和「怎」「恁」的限制有些不同,「怎」「恁」不能作述語。因此單音節的語素宜和「地」合併視為一詞。但狀聲的詞似乎應該獨自分離開來,因為可能的狀聲詞太多了(有的小說標點本還用引號把狀聲詞單獨隔起來)。如「颼(搜、醙)地」「撲(朴)地」。搭配「地」的狀聲的詞也有雙音節乃至三音節的,則當比照「地」搭配單音節狀聲詞的情形,和「地」分離開來,不合併為詞。

「地」雖然也附綴在詞組之後,但是這些詞組通常為套語,在斷詞上本可列為一個分詞單位,因此即使在這裡,「地」也可以視如詞尾一般。但就總體而言,我們還是寧可把「地」視為附屬詞,一方面是「地」可以結合的詞數目不少(但詞類比較固定,主要是狀詞和擬聲詞);另一方面是功能固定而非必用(可能和韻律有關)。

上頭說有些「地」所附綴的看來像是複合詞或詞組的結構,這種情形是較少數的。複合詞或詞組與「地」的分合原則我們且待下面AA、ABB等式與「地」的分合原則決定後再說。

那些加「地」的AA、ABB、AABB等式到底是否應和「地」合併為一個分詞單位,似乎很難一言而決。以下談一下斷為二詞和合併為一詞時可能遇到的問題。

先談分為二詞的問題。如果斷為二詞,就會面臨如下的問題:

1.「地」一旦分詞,就有要歸什麼詞類的問題。

2.詞彙中如果沒有加「地」的詞,也就不能直接比較有「地」和無「地」的詞在用法上的異同。

3.如果「地」獨立,那麼功能和「地」相當的「的」也應該標為同樣的詞類,但在詞類的自動標記時恐怕無法達到需求。

再談合併為詞的問題。如果「地」和所附綴的合為一個分詞單位,就會面臨如下的問題::

1.會導致詞典中有太多不必要的重複。如AA除了本式,還可以有加「地」「的」「裏」「價」的形式。如果某些加「地」的詞要列為一個分詞單位,那麼與此相對應而詞尾為「的」「裏」「價」也要合併為一個分詞單位。那麼這樣的合併到底要到怎樣的程度呢?是全部還是部分?更重要的是,不含附綴的形式和加「地」「的」的形式在語義和語法功能上通常是一樣的(「裏」「價」通常用於狀語,可能和較少見有關)。假如語義和語法表現差不多,何必合?

2.也可以用構詞律來預測可加「地」即可,不需要以增加詞的方式來解決。

比較上述二者,我們覺得如AA、ABB、AABB等式最好和「地」分作二詞。複合詞加「地」可比照AA式的分詞方式,詞組更不用說,也應和其後的「地」分作二詞。

「裏」的附加功能和「地」一樣,大致上和「裏」搭配的形式也可以在「地」前找到。如「白白裏」「平白裏」「猛可裏」。我們比照「地」,把「裏」獨立為詞。

「地裏」的情況有些不同,所搭配的語素似有些限制,因此暫時把它合為一詞。例如「黑地裏」「越地裏」「私地裏」。

「價」「假」「家」等應該是同一語素的變體(其中「假」「家」罕見),功能也和「地」相當,但作狀語為常,且跟在詞組後的似也比較常見。我們比照「地」,把它獨立為詞。如「格格價」「丕丕價」「大聲價」「每日價」「一陣價」「十日半月價」「送湯送水價」「甚般價」「每日家」「每日假」。

「個」可能也是「價」的變體,但通常看到的只限於「真個」,因此合併為一詞。

「生」的功能和「地」相似,只是從元明以後就比較不常用,處理辦法大致如「地」。因為代詞是有限類,所以即使是附在雙音節代詞後,也合併歸類。其他的雙音節實詞則仍然分詞。如「作摩生」「」。

「也似」「似的」「一樣」「一般」在功能上和「然」「地」等相當,且是雙音節的,更應獨立為詞。

六、並列結構

並列結構包括名詞、動詞以及虛詞的並列(如「朋友」「乏少」「了別」「悉皆」),原則上兩音節的並列結構都選為一個分詞單位(不包括專名的並列,如姓氏和地名)。

就語義言,我們選為一個分詞單位的並列結構包括同義、近義、反義等,也包括語義僅有些微關連而在語法次類範疇不相違背的(例如在能否接賓語上是一致的)。反義並列也標選,除了因為這樣可藉以觀察當時雙音節律運作的狀況,也因為有些反義並列並不能確定是否有轉義。如「大小」「多少」「反正」等。

分合原則:

1.語素結合後意義有轉化的一定選為一個分詞單位。但我們所選的並列結構包括同義、近義、反義等,也不一定要有轉義。

2.並列結構中有頓號時各自為詞,如果不含頓號,一般則合選為一個分詞單位。句號代頓號,處理辦法則如頓號。

3.三字以上的並列結構是否要合選為一個分詞單位,依以下辦法處理:

(1).三字的並列組合一般每個語素地位相等,是否合選為一個分詞單位,原則上以是否成組或成套(自成一個封閉自足的集合)為準。如「去來今」「枝葉果」。為了比較的方便,有時即使未完全成組或成套,也合選為一個分詞單位。如「地水火」。

(2).四字以上的組合如果其直接成分可以再往下切分(通常字數為偶數),原則上這個組合不選為一個分詞單位。如「我人 壽命」。如果四字以上組合每個語素地位相等,而且成組或成套,則不作切分而選為一個分詞單位。如「春夏秋冬」「眼耳鼻舌身意」。

並列複合詞的分離:

「沒情沒緒」「名目」

七、偏正結構

偏正結構分兩種:以名詞為中心語的:以動詞為中心語的。

偏正結構是否選為一個分詞單位,在我們的斷詞中是問題最複雜且棘手的,因為最不容易找到一個具體客觀的標準。因此在我們決定是否選為一個分詞單位時,往往需要多方的考慮,而實際上所設計的選詞標準也比較瑣細。

音節數目

偏正結構如果超過三字的,原則上不選為分詞單位。

意義

偏正結構為二字組合或三字組合的,無論是詞還是詞組,只要語素結合後超出組合義的(也就是意義有轉化的),就合併為一個分詞單位。(如「大人」「大麥」)。如是否有轉義難以確定而在兩可之間的,還是選為一個分詞單位。

離心

結構的詞類和中心語不一致的(也就是離心結構),該結構選為一個分詞單位。

自由性

偏正結構為二字組合的,也視語素結合的緊密度來看是否合併為一個分詞單位。如果中心語和定語都是附著語素,就合併為一個分詞單位。如果中心語和定語都是自由語素,且組合後意義無變轉,就分為二詞。如果中心語或定語中只有一個是附著語素,就視意義有無變轉和語素是否常用來決定是否合併為一個分詞單位。意義無變轉和兩個語素都是常用的合併為一個分詞單位。

三字組合

常用性

文言語素

定名式和狀述式是否有別?

定名式

(二)當數詞、指代詞、方位詞作為偏正結構的一個成分時選取標準如下:

1.數詞作為定語時,數詞如果只是作為對中心語的計數,則不合併為一個分詞單位(如「十 事」「七 夜」);數詞如果是用來指稱中心語類集合的總數,且這個集合在專業領域中其元素總是特定的某些個(如「六界」),則合併為一個分詞單位;又或者數詞是指該集合中某個元素的序數,也合併為一個分詞單位(如「一品」)。

在三音節的結構中數詞作為定語有兩種:一為「數詞+中心語」,如「三達智」;一為「「數詞+中心語」+中心語」,如「十種力」。無論屬哪一類,選為分詞單位的標準大抵相同。

2.指代詞作為定語時,一般獨立為一個分詞單位(如「吾 足」「此 人」「諸 佛」「一切 人」)。但如下的一些情況不在此限:

(1).有轉義時則應合併為一個分詞單位。如「吾子」是對人的尊稱,「己身」不只是「自己的身體」。

(2).指代詞作為定語的偏正結構如果有特殊佛學意義的合併為一個分詞單位(如「一切色」「一切智」「己印」)。

(3).新興或有新用法的指代詞可以和中心語合併為一個分詞單位。如「自」原為副詞,到中古漢語也可作定語,因此無論是否轉義或有無特殊佛學意義,凡是以「自」為定語的二字結構就標選。如「自印」標選為一個分詞單位。

(5).疑問代詞作定語的偏正結構如果只有兩個音節而且搭配頻率又高,則合併為一個分詞單位。理由是疑問代詞作定語時所結合的詞比較有限。如「何等」「何人」「何物」「何時」「何處」「何所」等為常用詞語,因而選為一個分詞單位。但「何藥」不選為一個分詞單位。

3.方位詞如果作為定語,一般和中心語合為一個分詞單位,如「東方」;如果作為中心語,原則上獨自視為一個分詞單位,如「城中」分為二詞。但「天下」「足下」等有轉義的仍合為一個分詞單位。又如「空」在上古原為「孔」或「空洞」之義。在中古,「空中」可以指「天空之中」,則合為一個分詞單位。方位詞連用而只指一個方位或定點的,合為一個分詞單位。如「東北」「中上」。

(三)有的結構的中心語不能確定為狀態動詞還是抽象名詞(動作動詞原則上仍視為動詞),原則上要看該詞是否仍常用作主語或賓語(包括作主語或賓語的中心語)。如果是的話,便視為抽象名詞。如果不是的話,便仍視為動詞,而該組合不視為偏正結構。如果一個結構還可以為一般副詞修飾的,便不視為偏正結構。如「妄想」可加「不」修飾,成為「不妄想」,歸到「其他」類中。

以抽象名詞為中心語的偏正結構,原則上和定語合併作一個分詞單位。

(四)偏正結構也依不同的字數各取標準來決定分詞單位。

近代漢語有時並不能以結合的緊密度來決定偏正結構是否為詞,以有無轉義來決定偏正結構是否選為一個分詞單位有時也還難以掌握。因此有轉義固然要選為分詞單位,我們同時也依賴詞的結合面的廣狹和使用頻率或搭配頻率的高低來輔助決定是否選為分詞單位。

1.二字的組合依下述標準劃分分詞單位:

(1).兩個實字如果結合面都廣,而且結合前後意義大致不變的,一般不合併為一個分詞單位。如「小 山」。兩個實字如果結合面都廣,而且結合前後意義大致不變,但彼此搭配頻率高,一般合併作一個分詞單位。如「女人」。

(2).兩個實字如果結合面都不廣,而結合後意義有轉化的,或者彼此搭配頻率高,一般合併作一個分詞單位。如「肉髻」「冠幘」。

(3).定語如為名詞(包括音譯詞),和中心語又非領屬關係,則一般合併為一個分詞單位。如兩字若為領屬關係,則一般不合併為一個分詞單位(如「王 足」「佛 所」)。但有轉義或在專業域領域中具有特殊意義的,則合併為一個分詞單位(如「佛心」)。又或者定語對中心語的限制僅為冗贅,也合併為一個分詞單位。如在「手掌」「車輪」中,「手」和「車」對中心語「掌」和「輪」的範限其實是無所增減。

(4).定語如為動詞,是否合併為一個分詞單位的原則如下:

當定語是結合面廣的狀態動詞(相當傳統所謂的形容詞)或動作不及物動詞時,如果沒有轉義或在專業域領域中不具特殊意義的,則不合併為一個分詞單位。一般定語如果只是描述感官上所呈現的空間、數量或屬性上的對比,是不合併為一個分詞單位的。如「大寺」「大城」「大燈」「大華」的「大」獨立為詞。但是如果偏正結構所指涉的超出其組合義(如空間成為有固定規格的,或者比原有組合義的範圍更加受限),則合併為一個分詞單位。如「大人」(貴族)、「大火」( 火災)、「大水」(水災)合併為一詞。是否有轉義有時可以採用轉換為句子的檢驗法。如「大寺」「大城」「大燈」「大華」可以轉換為「寺大」「城大」「燈大」「華大」而意義沒有增損,該偏正結構就視為沒有轉義(插入「之」來檢驗是否為詞在中古漢語是行不通的,故不考慮)。但這個檢驗法的答案也並非總是很確定的。

定語所指的如果只是中心語這個類的共通屬性或者對中心語的範圍無增損,也合併為一個分詞單位。如「白骨」「綠葉」「大海」。

定語結合面較窄的或和中心語搭配頻率高的通常和中心語合併為一個分詞單位。例如同樣形容美好的「善」「妙」「良」「好」等,只有「善」通常獨立為一詞(除非有轉義或有佛學意義);而「妙」「良」「好」的結合面較窄,通常和中心語合併為一個分詞單位。如「好衣」。又如「威」作定語主要是搭配容顏,所以和中心語合併為一個分詞單位。如「威容」「威顏」「威相」。

2.三個實字的組合是否合併為一個分詞單位原則如下:

(1).「雙音節+單音節」通常和佛學有關,因此合併為一個分詞單位。如「凡夫法」。如果和佛學關係不大,但有轉義或常用,也合併為一個分詞單位。如「族姓子」。

(2).「單音節+雙音節」是否合併為一個分詞單位視情況而定,通常就是有轉義或在專業域領域中具有特殊意義的合標為一個分詞單位。

(3).不能確定為「雙音節+單音節」還是「單音節+雙音節」的偏正結構,也標選為一個分詞單位。

3.四個實字或五個實字以上的組合原則上切分,但有特殊佛學意義而值得在佛學詞典上列出來加以解釋的合併為一個分詞單位。

(五)如果詞組中含有併合成分,無論含不含頓號,都合併為一個分詞單位。

(六)「狀語+述語」

在雙音節的狀述式中,怎樣的狀語可以和單音節動詞合併為一個分詞單位?決定於意義結合後的情況和常用性。

文言語素與文言語法:

「火急」「雪白」=「如火急」「如雪白」

「仇視」(如仇一般看視):「視」一般為文言語素,只出現在某些構詞成分中(「近視」「視野」);「仇」在白話中一般也不用來直接修飾動詞。

作狀語的語素是否獨立為詞,得考慮動詞後否可帶賓語。如果可帶賓語,而且狀語用在修飾動詞上還算常用,則狀語以獨立分詞為原則。如「緊追其後」的「緊」。

一般而言,常用的副詞如「不」「將」等是要獨自選為一個分詞單位的。但是如果「狀語+述語」轉為特定意義的則為例外。如「不退轉」「將來」合併為一個分詞單位。

如果動詞為附著的,也和副詞合為一個分詞單位。如「相處」。因為「處」只在文言中可以獨用,但在近代漢語中為附著成分。

副詞修飾副詞,除了法相副詞一般和其前的否定詞或疑問詞合併以外(配合現代語組的作法),原則上分詞。如「暫 不」「不 再」。有時有搭配固定而有特定功能的副詞也合併。如「不曾」相當現代在動詞組前的「沒有」。

副詞的結合面轉受限制的,也和中心語合選為一個分詞單位。如「自」在上古漢語是副詞,可以修飾相當多的動詞,可以使不及物動詞使動化或意動化。但因受中古漢語使動或意動用法衰退的影響,「自」和不及物動詞的結合就逐漸固化,這個結構就比較難以創生類似的新詞語了;同時「自」在上古漢語和動詞的結合較緊密,往往構成一個音步,到了雙音節動詞轉趨豐富的中古,雙音節動詞可以自為一個音步,「自」和動詞的結合就沒有那麼緊密了。「自」加單音動詞的結合面趨於縮小而固定,多半為上古漢語遺留的化石。因此「自」和單音不及物動詞的結合通常可選為一個分詞單位。如「自大」可以選為一個分詞單位。

此外,「非人」有特定的意義,故選為一個分詞單位。我們的「非」視為副詞而不視為動詞,故不列入述賓。

八、述補結構

本處的述補結構的補語並不包括時間補語和數量補語,主要指的是動結式、動趨式這種以動詞為補語的結構。如「解開」「脫出」。

(一)動結式

動結式的述補結構常常不易決定是否複合詞,是否應該列入詞典中。目前只要補語前可插入表能性的「得」「不」,我們都還算是述補複合詞。述補複合詞如果是不可分離的(包括含中嵌的),就合標為一詞(如「脫不了」「虧不盡」);但只要是可游離的,我們都分別標詞類,而加上語法特徵(即[+vrv] 和[+vrr])來表示其可以合併為詞(這麼做還要先考慮程式的辨認及統計是否有困難)。如:

「看(VE)[+vrv] 見(VK) [+vrr]」

「看(VE)[+vrv] 不(Dc) 見(VK)[+vrr]」

這樣做的好處是述補複合詞是否要算作一詞在處理上是一致的,也利於統計;同時也可以減少許多能性式的詞彙,這些詞彙本可由構詞律產生。

原則上我們不把「得」「不」視為述補複合詞的一個成分。我們建議:如果述補結構只有「V{得,不}C」的形式而無相應的VC式時(亦即只有插入「得」「不」的形式時,如「做他不著」),還是把「得」「不」獨自標類,而加上如[+vrd]的語法特徵(如下例);如果述補結構不但有「V{得,不}C」,而且也有相應的VC式時,就只把「得」「不」獨自分詞分類而不加上如[+vrd]的語法特徵(如上述「看不見」的標法)。

「看(VE )[+vrv] 不(Dc)[+vrd] 起(VA)[+vrr]」

這麼做不但在標選方式上取得一致,同時可避免某些性質介於補語和動詞詞尾之間的常用詞(亦即所謂的「動相補語」(phase complement)在歸類上的困擾。如「忍住」的「住」。這種詞可附在許多動詞之後,如果把它和那些動詞都合併列入詞典中,那麼將會增加不少詞。如果我們把動補式都分開來而僅以語法特徵來連繫,那麼可以讓詞典不列入這些動補結構,若需要研究時也可以很容易把這動補結構都列出來。

另外述補複合詞分開標類在詞類的標注上也有好處,理由另見《近代漢語詞類標注手冊》中的討論。

在「V不C」式中有「V不得」「V不了」,我們建議把「不得」和「不了」合併為一詞(「不得」為常用補語,性質有些像後置的法相副詞),並加上[+vrr]的語法特徵。最主要的是因為否定式的「不得」和「不了」的「得」「了」可以由「不」,仍具實詞性,而相應的VC式應為「V得」和「V了」(還可以有「V得了」),其中的「得」「了」一般卻只能歸入詞尾或助詞。

「V得慌」的「得慌」視作獨立的後置副詞,「得」和「慌」合詞,算是「得」中的例外。

常用的「不-V」式如果已固化而表達特定的語法功能,也可比照「不得」作同樣的處理,如「難道...不成」的「不成」。

(二)動趨式

動趨式的述補結構的補語為趨向動詞,如「上」「下」「起」「回」「轉」「出」「進」「入」「過」「開」「攏」等。另外還有「來」「去」,也算是趨向動詞,但「來」「去」還可放在其他趨向動詞後成為複式的趨向動詞。以下暫時把「來」「去」和上述的趨向動詞分開來以便說明。

動趨式因為也有插入「得」「不」的形式,或者插入動詞詞尾,因此趨向動詞和動結式的述補結構處理一樣,也和前面的述語動詞各自分開分詞分類,並加上語法特徵以資連繫。但趨向動詞還有加上「來」「去」的複合形式。「來」「去」和其前的趨向動詞還可以游離開來。目前「來」「去」和其前的趨向動詞在分詞上我們想到如下的處理法:

首先,在含複式趨向動詞的動趨式述補結構,趨向動詞到底和前面的動詞還是和後面的「來」「去」結合得較緊,是很成問題的。這個問題牽涉到分詞的問題。動詞詞尾總在趨向動詞前(如「V了出來」),因此趨向動詞看來和「來」「去」結合得較緊。但如果有動詞賓語的話,賓語又以放在趨向動詞和「來」「去」。之間為較常見「V出NP來」。更易令人迷惑的是,有時趨向動詞出現冗贅的重複,好像趨向動詞和中心動詞及「來」「去」都結合得緊(如「V出NP出來」)。因此我們如果打算把整個含複式趨向動詞的述補結構拆成兩詞,就不知是在趨向動詞前分詞還是在趨向動詞後分詞。我們目前的處理上仍然把這樣的結構視為一體,但是仍作切分,而以語法特徵來加以連繫。我們給中心動詞[+vrv] 的語法特徵,而給趨向動詞和趨向動詞[+vrr] 的語法特徵,所以在實際的分詞上是讓趨向動詞和「來」「去」保有較緊密的關係。

其次,趨向動詞和「來」「去」既是可分離的,在分詞就有如下的幾種辦法可供選擇:

1.無論是否相連,趨向動詞都和「來」「去」分詞:

此法好處是一致,壞處是要加更多的語法特徵(碰到「V出NP出來」這種句式時,在處理上更是棘手)。「來」「去」一旦獨立開來,在處理上有兩種辦法可供選擇:

1a.視「來」「去」為完全獨立的詞,比照其他句末的「來」「去」,可能的詞類為T。缺點是認為「來」「去」是和其前的「來」「去」為不相關的助詞,而且表示動貌的「下去」「起來」也勢得拆開來。

1b.把「來」「去」也加上和趨向動詞一樣的語法特徵[+vrr],詞類和動詞的「來」「去」相同(即VA),只有表示動貌的詞類另外處理(如趨向動詞和「來」「去」都給Di)。因為「來」「去」既然視為動詞的補語,就不該是虛詞了。「來」「去」視為動詞還有一個理由:趨向動詞如果單獨和「來」「去」構成述補結構,兩者間可插入「不」而造成能性式的合併為詞(如「上不來,下不去」),因此在這個地方的「來」「去」看來仍像是動詞,而且和趨向動詞關係很密切。儘管在「V+趨+{來,去}」時,「不」總在趨向動詞前,也很難說「趨+{來,去}」這樣的合併結構和附在其他動詞後「來」「去」就變成另一個不相干的助詞了。

這個辦法的缺點是比較麻煩,因為要連用三個語法特徵來連繫動補結構的三個語素,而且至少有兩個語素要標上[+vrr])。另外一個問題是其他句末的「來」「去」都是助詞,作為動趨式補語的「來」「去」很難說功能有明顯的不同。

2.趨向動詞都和「來」「去」相連時合詞,不連續時分詞:

如採這個辦法,則如「下去」「起來」無論為補語還是動貌標記,都合併為詞(如果是一般補語,就合標一個語法特徵[+vrr],如果具有動貌功能,就合標一個語法特徵 [+asp] ),在分詞上可以避免要先分辦是否動貌標記的困擾,而且趨向動詞加「來」「去」的組合很有限,並不難難找出來作統計。「來」「去」和趨向動詞分離時,也如上述第一法一樣,有兩種辦法可供選擇:

2a.一是視為完全獨立的詞,比照其他句末的「來」「去」,可能的詞類為T。這樣做有一個問題:「來」「去」和趨向動詞分離時標為T,但與和趨向動詞相接連時看來並無多大差別。

2b.把分離的「來」「去」也加上和趨向動詞一樣的語法特徵[+vrr],詞類和動詞的「來」「去」相同(即VA)。因此也是至少有兩個語素要標上[+vrr])。這樣做的缺點是不一致,好似分離的「趨-來」和相接連的「趨-來」是變成不同的詞;而且「來」「去」和附在其他動詞後「來」「去」就變成不相干的詞了。。

3.混合的辦法:無論是否相連,趨向動詞都和「來」「去」分詞,但表示動貌的「下去」「起來」合詞。這個辦法,除了表示動貌的「下去」「起來」合併為詞以外,「來」「去」無論是否和趨向動詞連接,都分另外分詞。而且「來」「去」的標類也有兩種選擇。一是標VA而以[+vrr]來連繫。一是一致標為T。此法的缺點是較複雜,在自動斷詞上較為困難;而且萬一補語和動貌標記界線不很清楚時,在分詞上先就是一個問題了。

比較上述諸方案,我們覺得2b的缺點相對上比較可以容忍,而且在標記作業上是較簡便的。以下給個例示:

趨向動詞作為補語時:

「走(VA)[+vrv] 下去(VA)[+vrr]」

「走(VA)[+vrv] 下(VA)[+vrr] 樓(Nc) 去(VA)[+vrr]」

「做(VC)[+vrv] 出(VA) [+vrr] 十來兩銀子的氣質 出來(VA) [+vrr]」

表示動貌的趨向動詞在語法上其實仍可視為補語,並不完全虛化。如對應於「唱起來」和「(繼續)走下去」有「唱得起來」「唱不起來」和「走得下去」「走不下去」等式。從這裡可以看出它的表現和別的補語是一致的。如果「起」「下」已虛化為詞尾,不應仍受否定詞的修飾或。我們把這種表示動貌的趨向動詞仍視為補語,仍給與它的動詞原類,但還加上[+asp] 的語法特徵。這個語法特徵的意思是具有動貌功能的補語。

「唱(VC)[+vrv] 起(VAC)[+asp] 歌(Na) 來(VA)[+asp]

「走(VA)[+vrv] 下去(VA)[+asp]」

當趨向動詞作為中心動詞時:

「入(VCL)[+vrv] 去(VA)[+vrr] 房(Nc) 裏(Ng)」

「入(VCL)[+vrv] 房(Nc) 去(VA)[+vrr]」

(三)動詞配給與動詞

相當現代漢語雙賓動詞「V給」的是「V與」,「與」和動詞的搭配也可視為一種動補結構,因為「與」的動詞性比一般的介詞要強得多。理由如下:

近代漢語動詞詞尾可在「與」的前面或後面,如「V了與NP 」和「V與了NP 」都有。但「V了與NP 」的NP以單音節為主,可能和節律有關(NP可能為弱讀,避免和弱讀「了」連用),。從這裡看,中心動詞為「與」。

「與」決定時貌和論元。

「V了+NP+與+ NP」比「V+NP+與了+NP」為常,後者雖有而較不自然。從這裡看,主要動詞又像是V。

可否用加語法特徵解決?

「V了與 NP」

(3)論元:「與」決定論元。「V與」的「與」歸為動詞(是否要用語法特徵(如+vrr)來和主要動詞用法區別開來?)。如果V為有「給與」義的三元動詞,可以預測可以加「與」,也可以不用加;如果V為不是三元動詞,可以預測必須加「與」來表達「給與」義。

比較:

送給他三塊錢 / 送他三塊錢 / 把三塊錢送給他 / 送三塊錢給他

付給他三塊錢 / 付他三塊錢 / 把三塊錢付給他 / 付三塊錢給他

交給他三塊錢 / *交他三塊錢 / 把三塊錢交給他 / 交三塊錢給他

分給他三塊錢 / ?分他三塊錢 / 把三塊錢分給他 / 分三塊錢給他

寄給他三塊錢 / *寄他三塊錢 / 把三塊錢寄給他 / 寄三塊錢給他

拿給他三塊錢 / *拿他三塊錢 / 拿三塊錢寄給他 / 拿三塊錢給他

「與」在動詞前和動詞後的區別:前者歸作介詞,後者歸為動詞VD。

由於「V與」是可分離的,因此不管是否連用,都各自標類。如果V也是三論元的動詞,則可以考慮把V和「與」各加上[+vrv]和 [+vrr]的語法特徵。

九、述賓結構

近代漢語的述賓結構是可游離的,因此是詞還是詞組有時不好判斷。我們根據如下的標準來決定近代漢語的述賓結構是否視為複合詞:

1.述語、賓語結合後意義轉化的。如「出家」「將軍」。

2.述語、賓語間結合固定者要選。如「稽首」「如是」「若此」。

9.動詞「有」「無」及準繫詞「為」「如(若)」等原則上不和賓語合選,除非和賓語結合固定的,或者組合後意義有轉化的。如「無色」「有漏」。

由於述賓複合詞是可以游離的,因此我們認為也當比照述補複合詞,只要是可游離的,我們都分別標詞類,而加上語法特徵(即[+spv]和 [+spo],這個語法特徵中的sp在這裡的意義是「可游離的」)來表示其可以合併為詞;述賓複合詞如果是不可分離的,還是合標為一詞(如「結果他」「抱怨」)。述賓複合詞分詞而加上語法特徵還有詞類標注上的好處,理由見《近代漢語詞類標注手冊》中的討論。

大部分的述補複合詞可視為在句法層次結合成詞,因此在詞典中可以不列整個述補複合詞,只列動詞也就可以了(部分還是得先列入詞典中);但是述賓複合詞的情況看來不同,最好視作在詞彙層次就已構成,否則不好處理。但是哪些述賓結構要視為形成於詞彙層次,也不是都很容易決定的。

十、介賓結構

介賓結構選為一個分詞單位的限於二字組,主要是上古漢語遺留下來的,通常已固化為詞。如介詞在賓語前的「於是」和介詞在賓語後的「是以」「何以」「何因」「何從」等。介詞在疑問代詞賓語前的二字組合也合併為一個分詞單位。如「從何」「由何」「於何」。

十一、主謂結構:

主謂結構其實和以抽象名詞為中心語的偏正結構是不容易區分的,最主要是因為動詞是否名語化在漢語中是一個頗富爭議的問題,不過一般列在偏正結構的中心語一般是常用作主、賓語而且多非動作動詞。主謂結構的例子如「年少」「師子吼」。

十二、縮寫或節略

縮寫或節略選為一個分詞單位。如「從來」相當「從始以來」,「大梵天子」相當「大梵天之天子」。

十三、成語、諺語

成語、諺語原則上選為一個分詞單位。

十四、其他

(一)不連續結構

述補、述賓以外的不連續結構一般也不合選為一個分詞單位。

不連續結構如果因中間成分不出現而連在一起時,視其是否尚可分解或有特定的功能而決定是否選為一個分詞單位。

動詞後接「為」「成」「作(做)」

「叫做」是來自「叫X做Y」的,「叫」和「做」原非同一句範疇的動詞,只是一旦夾在二詞中間的詞為隱含時,兩字就常連在一起用。由於中間的詞可以復,因此「叫X做Y」的「叫」和「做」分作二詞。「叫」和「做」的呼應可以從「叫」的語法記載中預測出來。其他結構相同的處理方式相同。

「奈何」雖來自不連續結構「奈....何」,但在近代漢語中也當作問方法的固定詞彙,一般人未必知道其原本的用法,因此選為一個分詞單位。

另外如「難道...不成」的「難道」和「不成」雖前後呼應作為反問句,我們也還是視為二詞。

(二)非結構

「非結構」是說其中的各語素原來並不是共為一個成分的。如「然而」「然後」原為承指代詞「然」加上連詞「而」和副詞「後」,後來才凝結為連詞。

有些上古常用的副詞到中古時,因為失勢而有時就成為副詞、連詞的附著語素,如「復」「自」之類。到近代漢語時,「自」仍可作為副詞的附著語素。

當副詞、連詞後連續接「是」和動詞組的時侯,「是」是應分析為詞尾還是獨立的詞往往頗費斟酌(「是」在這種地位原先可能是起烘托焦點的作用,但久而久之就弱化了)。,有

「若是」和「若」

助詞連用時的分與合。

「了麼」

「V於NP」

動詞後加「於」來引介名詞組的「V於NP」結構是上古漢語的遺留。

「V有」

(三)文言遺留的特殊語序

賓語為疑問代詞而又在動詞或介詞之前的兩字組如果為常用詞語也合併為一個分詞單位(如「何如」「何若」「何以」)。如果不是常用詞語,則分為二詞(如「今欲何行」的「何」和「行」分為二詞)。


參、分詞和詞庫現代漢語組分詞不一致的地方及理由

一、與詞庫現代漢語組在分詞上主要的差異(初步構想)

草案(合) 近代漢語組(分)

序詞「第接數詞」數詞 第七 第 七

數詞 五千三百六十一 五 千 三 百 六 十 一

分數 七分之三 七 分 之 三

表概數「多、來、幾」 二百多 二 百 多

述補結構(述-結) 打死 打 死

述補結構(述-趨) 升上來、送去 升 上來、送 去

述補2+1結構 演奏完 演奏 完

動詞重疊(AA) 唱唱 唱 唱

動詞重疊(ABAB) 考慮考慮 考慮 考慮

動詞重疊(AAB) 聊聊天 聊 聊 天

量詞 片片、一片片 片 片、一 片 片

V-到 走到 走 到

V-為 流為 流 為

V-成 剪成 剪 成

V-作 鑄作 鑄 作

V-給 送給、贈送給 送 與、贈送 與

V-有 收有 收 有

V-於 居於 居 於

偏正式(動詞為中心語) 接頭詞與單音節動詞合 接頭詞與單音節動詞分

(例:重做、改寫) (例:重 做、改 寫)

方位詞 之中,之上,之後 之 中,之 上,之 後

正反問句 喜不喜歡、可以不可以 喜 不 喜歡(第一個「喜」 加語法特徵)、可以 不 可以


近代漢語詞類標注手冊

這個手冊主要為標注明清小說的詞類而設,因此主要的適用對象也是明清小說,詞例、例句也多採自這個範圍。

詞類標注

壹、分類原則

多功能詞的歸類

一個詞語如果在不同的語法地位意義有明顯的不同,就視為不同的詞。譬如某個字用作狀語時和用於述語時意義很不同,則分別歸類為副詞和動詞。

一般名詞如果也用於定語或狀語,仍視為名詞(如時間及地方名詞),但此外的詞在跨類上可能別有問題。

(1)可作述語、定語、狀語:不跨類(動詞);跨類(其一,依功能分三類;其二,作述語、定語為動詞,作狀語為副詞)。

(2)可作定語、狀語:不跨類(非謂形容詞);跨類(依功能分非謂形容詞和副詞兩類)

(3)可作述語、定語:動詞

(4)只可作述語?

(5)只可作定語:非謂形容詞

(6)只可作狀語:副詞

歸類決定的牽涉到主要用法?如果雖可跨類,卻主要用作狀語。

特別要注意狀詞和代詞,特別是有些以作狀語和定語為主的,但通常為狀語,而且有的只作狀語。

狀詞要算是虛還是算是實?加「地(的)」是否要和不加「地(的)」的狀態動詞分開來處理?

一般實詞

一般實詞如果能用作名語(主語、賓語、介詞賓語),而不作述語用,則無論在任何地位,都歸類為名詞;如果能作述語用,而不作名語用,則不論在任何地位,都歸類為動詞。如果只能用作定語就歸類為非謂形容詞;如果只能用作狀語,就歸類為副詞;如果只能用作定語及狀語,就歸類為非謂形容詞。

虛詞

代詞

代詞是有限類,而它的語法功能又很重要,需要另外處理:

「所有的人」的「所有」只能作定語,要歸入哪一類?

一個詞語如果在不同的語法地位意義有明顯的不同,就視為不同的詞。譬如某個字用作狀語時和用於述語時意義很不同,則分別歸類為副詞和動詞。和

指示

地方

情狀:「恁」「恁地(的)」;

狀詞

(一)詞綴與附屬詞

常用且組合意義一定的詞綴獨立標類(將來可用構詞律合併的詞綴獨自分詞)。如「第」。

「地」「裏」「地裏」「價」「家」「然」「也似」「似的」

介詞和動詞的分界與其歸類原則:

介詞還是動詞?

近代漢語有些詞很難決定要歸入P還是動詞。這些詞像常用的虛詞,但又有動詞的徵性。如「將」「把」「與」「除」「和」「同」之類。以下略示處理辦法:

「送與」的「與」在近代漢語仍可歸入動詞,可視同做主要動詞的「與」。不過因這類詞不但常用而且和其他介詞在功能上的分際也有些模糊,即使歸入動詞,仍需要加以適度的區隔。將來採行的方案可能是:從不作述語用的詞歸作介詞,也兼作述語用的歸入動詞。

如「跟」「和」「同」可以作主要動詞及次動詞,都可帶詞尾。因此似可歸入動詞VC1或VJ,這種用法的「和」「同」可以和「和」「同」的不及物用法(VH)分作兩類。「為了(著)」「除了」有了特殊的用法而不同於一般的動詞時,則可連同詞尾歸入介詞或連詞。

關於辨識原則:

(1)地位:如果只有次動詞用法,則歸為介詞。如「共」。

(2)時貌:「著」「了」。歸為動詞。但和第一項衝突時怎麼辦?注意有的次動詞同時跟著「著」「了」。

(3)論元:「與」決定論元。「V與」的「與」歸為動詞(是否要用語法特徵(如+vrr)來和主要動詞用法區別開來?)。如果V為有「給與」義的三元動詞,可以預測可以加「與」,也可以不用加;如果V為不是三元動詞,可以預測必須加「與」來表達「給與」義。

比較:

送給他三塊錢 / 送他三塊錢 / 把三塊錢送給他 / 送三塊錢給他

付給他三塊錢 / 付他三塊錢 / 把三塊錢付給他 / 付三塊錢給他

交給他三塊錢 / *交他三塊錢 / 把三塊錢交給他 / 交三塊錢給他

分給他三塊錢 / ?分他三塊錢 / 把三塊錢分給他 / 分三塊錢給他

寄給他三塊錢 / *寄他三塊錢 / 把三塊錢寄給他 / 寄三塊錢給他

拿給他三塊錢 / *拿他三塊錢 / 拿三塊錢寄給他 / 拿三塊錢給他

「與」在動詞前和動詞後的區別:前者歸作介詞,後者歸為動詞VD。

「將」「拿」「同」

「被」「與」「給」「著」「乞」「喫」作被動的標誌,其中「與」「給」「著」又有致使用法,是否應當區分為不同的類?。

「與」在主要動詞前有兩用:一為「與同」義,可歸入介詞或連詞;一相當「為」,是否該歸入動詞(帶句子的雙賓動詞),「給」「著」的致使及被動用法也歸此?

「被堅執銳」

副詞與連詞的區別

「又」

副詞還是動詞?

評價副詞和動詞並不一定好分,原則上如果能同時可用於述語和狀語的而意義又沒有明顯的不同時,就只歸入動詞。如「虧不盡」「幸虧」都不能單獨作述語,因此都是副詞。

副詞的細類

是否該多分類?

如關連副詞

關連副詞

評價副詞與法相副詞

評價副詞與方式副詞

評價副詞與時間副詞

分類原則的討論

多功能與跨類

一個詞如果可作狀語、述語、定語、補語等,一般的給類原則應當給與動詞類。但是有些詞雖然可以在狀語及以外的地位出現,常見的卻是作狀語,其他

地位出現就比較有限制。這使得我們在歸類上頗為難決。這其中最不容易處理的是重疊詞和代詞。以下述說我們的處理方案。

1.重疊詞:

重疊詞如「AA(地)」「ABB(地)」「AABB(地)」最通常是用作狀語,但也可以作述語或定語、補語。「A地」及其他加「地」的狀語以外的用法就比較少。

我們不採用跨類的作法,原則上把這類視為不及物的狀態動詞(VH)。但如果重疊詞只作狀語,歸入副詞;如果重疊詞只兼作狀語及定語,則歸作非謂形容詞(VA)。

要算是什麼詞類,加「地」以後是否要合併為一個分詞單位,和不加「地」的形式是否要分作二詞(詞類亦各自決定),頗不易決定。

如「看起來」這種含有「起來」的Dbc類則放棄,「起來」將獨自為詞。

2.代詞:

代詞數目有限,可採取跨類(由地位決定)或不跨類的作法。若採不跨類的作法,則選類容易,且利於自動標類。若採跨類的作法,有助於將來的統計,目前我們暫時趨向於採取不跨類的作法。

一個代詞如果能用作名語(主語、賓語、介詞賓語),而不作述語用,則無論在任何地位,都歸類為名詞(指示詞「這」「那」比較特殊,歸入定詞,另外處理),如「我」「那裏」。如果能作述語又作定語、狀語,而不作名語用,則歸類為動詞,(只是有的代詞常用作狀語,但作述語卻很少見),如「恁的」;如果只能用作定語及狀語,就歸類為非謂形容詞;如果只能用作狀語,就歸類為副詞,如「那」(上聲)。

如「什麼」「這」分別歸入Nh和Nep類。「那(哪)」可歸Nep類和Dj類,「怎的」可歸在Dj類和VH類中。但此法不。,但目前代動詞和代副詞在詞庫現有的類中將無位置可放,一個辦法是全部歸在Nh中。

3.時間詞;

時間詞若是只能作狀語或定語,建議歸入VA。

貳、和現代漢語組詞類標注不一致的地方及理由

一、可游離的複合詞詞類的標示

(一)述補複合詞詞類的標示:

述補結構無論是否複合詞或相連,都分別標類而加上語法特徵(即[+vrr] 和[+vrr]),這個做法已在斷詞手冊中說明。現在要談詞類的標示法(部分說明已見於該手冊中)。

對於可游離的述補複合詞,我們考慮把兩個語素各自標上語素原有的詞類,而非整個述補複合詞的詞類。如詞庫現代漢語組的「叫(VC)[+vrv] 不(D) 醒(VC)[+vrr]」,或許就改標為「叫(VC)[+vrv] 不(Dc) 醒(VH)[+vrr]」。如此一則不必考慮「叫他不醒」要怎樣標類了;一則這樣可以和述賓複合詞的標示法取得一致,因為現代漢語組的述賓複合詞都是標示原類的。

另外,如果述補複合詞的中心動詞同時又是述賓複合詞的中心動詞時,就可以避免中心動詞同時又是及物動詞又是不及物動詞的困擾了。

如果述補複合詞的語素詞類分標,那麼整個述補複合詞的詞性要如何決定,是否在計算上會造成問題呢?

原則上整個述補複合詞的詞性要合併兩個語素來決定。如果其中一個語素為及物動詞,或者是VAC、VHC,那麼整個述補複合詞即可以帶賓語。如果第二個語素(即補語)原為可倒裝主語的動詞,那麼整個述補複合詞應也可以倒裝主語。我們認為述補複合詞的詞性的預測困難並不大,只是希望有程式可以有效的計算出來(預計可能只有很小的部分無法預測出來)。

考慮到「不得」為「得」的否定式,可能把「不得」標為一詞(「不了」情形類似)。但對應於「不得」的「得」可能多標為DE(我們建議另歸助詞T3類),「不得」似無可歸類(目前除了程度副詞,尚未設其他的後置副詞類),或者仍然把它視為補語而加[+vrr]的語法特徵,或者把它改為助詞類。

V和「與」的搭配:「與」標為VD類。

(二)述賓複合詞詞類的標示:

建議述賓複合詞如果可以游離,那麼無論是離或合,詞類標注,都不採用複合後的詞類,而以語素的詞類為準,並另外加上語法特徵來顯示為述賓複合詞(如[+spv] [+spo])。理由如下:

1.述賓複合詞如果加上語法特徵,就足以顯示為述賓複合詞。而且述賓複合詞通常是不及物動詞的,我們可以用其他的辦法來處理及物用法的預測問題(如永遠不能分開的及物性述賓複合詞合併給類;表示認知的述賓複合詞比較可能帶句子賓語)。此外,有時及物或不及物的分界也不是很清楚。例如「動火」在,近代漢語為一般不及物的,但偶然可帶賓語。

2.述賓複合詞和一般述賓結構的分界不一定很清楚,如果詞類標注上保持一致,而以加上語法特徵來區別,則在修改上比較容易。而且述賓複合詞也常常可以分離開來,有時可以把賓語作成領屬賓語。

大部分的述補複合詞可視為在句法層次結合成詞,因此在詞典中可以不列整個述補複合詞,只列動詞也就可以了(部分還是得先列入詞典中);但是述賓複合詞的情況看來不同,最好視作在詞彙層次就已構成,否則不好處理。但是哪些述賓結構要視為形成於詞彙層次,也不是都很容易決定的。

二、類的增減:

(一)舊類的刪併:

1.Cab:本類刪除,改歸T6。原本為「等」「等等」「之類」所屬的類。

2.Ncd:此類原名位置詞類,和方位詞(Ng)頗有重疊,今取消,改歸Ng。方位詞只有和他詞成為複合詞時不列為方位詞。

3.Neqb:本類刪除,改歸T7。原為後置數量定詞,它的用法都接在量詞之後。原本適用於如下的詞:三點、五十歲出頭、兩丈

4.Cba(移動性前繫連接詞)和 Cbb(非移動性前繫連接詞)合併:

現代漢語的.Cba和Cbb的區別,在近代漢語並沒有那麼清楚,因此合併為.Cb(關聯連接詞)一類。

(二)新類的增加:

1.在標注副詞時,把現代漢語組電子詞典原有的副詞細類回補進來:

詞庫近代漢語組副詞類實際標注的類比現代漢語組現在進行的標注還要細,但原則上還是採用現代漢語組電子詞典中原有的分類。這是針對研究重點的不同而採取的因應手段。如近代漢語組第一年重點在副詞,因此採用現代漢語組原本較細的分類。也就是現代漢語組原有的Daa、Dab、Dba、Dbb、Dc、Dd、Dfa、Dfb、Dg、Dh、Di、Dj、Dk的分類在標注時都補了回來。

2.近代漢語組自添的類:

以下的類是近代漢語組新添的類(其中T類增加的理由已見於斷詞手冊):

[Dl] 關連副詞:如「也」「又」「就」「便」「才」「卻」等。這一類現代漢語組的電子詞典原來的歸屬不一。如「也」為Dbb;「又」為Dd和Caa;「就」為Daa和Dd;「才」為Daa。暫且不論這些詞都可能有表示評價的用法(可以視為引伸附帶的功能),只論其他的用法。這其中「就」和「才」的Daa用法因為功能明確,可以勿論。其他在歸類上都不無問題。

「也」電子詞典歸入Dbb,這是表示評斷的副詞。但「也」用在如「他吃你也吃」「也有風也有雨」這種句子是很常見的,卻很難看得出有什麼評斷意味。傳統上「也」比較常見的是歸於範圍副詞,因為至少可以說是以述語為其論元。

「又」分別列入Dd和Caa固然也是一法。不過把和時間無關的「又」列入Caa卻不見得理想,因為「又」一般是不放在主語之前的,所以應該列為副詞。如「他又肥又胖」「草兒又長,馬兒又肥」。把「又」放在關連副詞中,可以統合有時間關涉及無時間關涉的兩種用法,而且可以避免歸作連詞的問題。

「就(便)」「才」都可涉及時間,但是只有「就」列了時間副詞Dd的類,其實「才」也有涉及時間的用法。如「他才到」。另外,「就(便)」「才」都有表示條件而和時間無涉的用法,現有體系卻無處可放。如「這樣才對」「這樣就對了」。我們認為,把「就(便)」「才」放在關連副詞中,也可以統合有時間關涉及無時間關涉的兩種用法。

我們把這些詞歸入關連副詞,也是過去有人使用過的辦法。這個歸類法不但可以強調它聯絡句子的特徵,而且可以避免某些歸類上可東可西的困擾。

T1(預留類)動詞詞尾:表動貌。如「了」「著」「過」「將」等。

T2.(預留類)「的(底)」「之」:附綴於名詞修飾語的詞。「之」其實和「的(底)」功能有所差別,後面一定得有中心語名詞。

[T3].「得(的)」:表示可能性的動詞後綴,或作為引介補語的連接詞。如「曉得」(比較「曉不得」)「打得著」「娶得他起」「吃得口滑」。

[T4].位在描繪情狀的詞語之後的: 如「地(的)」「裏」「價」「也似」「似的」「一樣」「一般」等。

[T5].可附在從句或狀語後,表示條件、時間、原因等的:「時」「(的)時節」「的時候兒」「的話」「上」「起見」「來」「以來」。如「若是死時,與你們同死」「他去腰裏摸時,搭膊和書都不見了」「為此上」「九歲上」。

[T6].位在名詞或名詞組之後,表示複數的:如「們」「等」「等等」「之類」等。這一類如果位在一般名詞後就獨立為詞,在代詞後則合併為一個分詞單位(如「我們」「我等」)。

[T7].位在數詞之後的:如表約數或餘數的「來」「餘」「多」。我們把數字的組合也當作詞組,因此這幾個語素也視為附屬詞,因此獨立為詞。如「五百來個」。

[T8]「者」「所」:「者」「所」可分析為代詞性的附屬詞。除了部分附著在單

詞後的「者」與其所附著的詞合列為詞外,「者」原則上獨立為詞。

[]擬聲詞

成語諺語

1.擬聲詞

另外獨立分類的理由:

(1)很難納入現有的詞類中(以作定語和狀語最多)。

(2)變異太多,即使勉強納入現有的詞類中,和別類混在一起定性或統計,也沒有多大意義。如果獨立分類,在統計時可以視情況來取捨。

2.成語、諺語、引詩詞、引古語

除了四字格的成語可以比較活用於句子中,其他較長串的諺語、詩詞、古語,無論是內部或對外都沒有標示詞類的價值,可以整串用一個符號來標示(其中有標點符號的,可看清況用feature來連繫)。至於四字格的成語的語法功能大致一定,是否併入其他詞類不是很重要。假如要想對固化的成語另作研究,也可以獨立出一類來。

三、內容有更動的類

詞類標注的不一致有的只是個別詞實際歸類的不同而非分類不同,但也有因對類別定義有所更動而導致部分詞歸類的不同。

如[Dl] 關連副詞:如「也」「又」「就」「便」「才」。

Dcd取消

T

四、個別詞在詞類上的變動

「來」「去」不標D

五、關於語法特徵

(一)名物化的徵性處理辦法的差別

標 [+nom] 的名化動詞將只限於不後接賓、補語和前面無狀語修飾的。如現代漢語組「學生的不(D)合作(VH)[+nom]」,我們只標作「學生的不(D)合作(VH)」。

對於「有些」「有一些」「有點」「有一點」,無論它是在動詞前還是在名詞前,我們的分詞都是一致的,也就是都把「有」和「些」「一些」「點」「一點」分為不同的詞。因此如現代漢語組的「他 有一些(Dfa) 瘋狂(VH)」將改分析為「他 有(V-2) 一些(Neqa) 瘋狂(VH)[+nom]」。其中「瘋狂(VH)」的[+nom]也可以不採用。

此外,如「快快說明白」「聒絮不住」中的「明白」「不住」在「個」後頭,有些像是名物化,但我們暫時還是不加上[+nom]的特徵。

(二)可分離結構的語法特徵

述補複合詞、述賓複合詞語法特徵在標記上的的異同已如上述。近代漢語還有似乎把並列複合詞分離開來的一種現象。如「沒」「沒」「有」。這種現象雖不經見,但在分詞和詞類標注上總是應給與適當處理的。我們覺得應可分為四個分詞單位,而把其中分離開來的並列複合詞標上同樣的詞類和加上語法特徵(只是尚無現成的語法特徵可資利用)。

近代漢語詞類標注簡表

文檔上標注的類別和詞庫現代漢語組有異者下加線。

Angel [A] 非謂形容詞。 是純粹的形容詞,不具述語作用。例:公共、共同。

[Caa] 並列連接詞,類連接詞多半同時具有介詞的特性。例:與。

Cab (刪除,改歸T6)

[Cb] 句子連接詞。這一類原包括Cba和Cbb兩類。原Cba類如雖然、因為、即使、只有(原 來的「時」「的話」和「起見」等改歸T5);原Cbb類如:雖、不但、可是、 所以、那麼、否則、而且。

Cbb(刪除,和Cba合併為Cb)。

[Daa] 表範圍和數量的副詞。例:就、才、只、光、不過、約、正好、約、僅僅。

[Dab] 表範圍和數量的副詞,不可以直接修飾名詞組。例:都、通、一。

[Dba] 法相副詞。例:也許、大概、一定、:必須、可以、得。

[Dbb] 表示說話者的評斷的副詞。例:幸虧、果然。

[Dc] 表否定的副詞。包括:未、沒有、沒、不。

[Dd ] 時間副詞。例:先、立刻。

[Dfa] 動詞前程度副詞。例:很、非常。

[Dfb] 動詞後程度副詞。例:得很、之至。

[Dg] 地方副詞。例:處處、到處。

[Dh] 方式副詞。例:逐一、從頭、一起。

[Di] 標誌副詞。幾乎都緊接在動詞之後,表現時態。例:了、過、著、將(如「走 將出去」的「將」)。(建議此類將來歸在T1)

[Dj] 疑問副詞。例:可、為什麼、幹麼。

[Dk] 句副詞。有轉變或連接語氣的功能。例:總之、據說。(建議此類將來改歸 Cc,可改稱為「語段連詞」)

[Dl] 關連副詞:如「也」「又」「就」「便」「才」「卻」。

[DE] 即:的、底、之。(建議此類將來改隸T2)

[ I ] 感歎詞。表示說話者的口氣或態度的獨用語式。例:啊、喂、唉。

[Na] 名詞。例:泥土、鹽、水、牛肉;桌子、杯子、衣服、刀;夢、話、原因、 勾當;風度、香氣;三餐、五臟六腑、四肢;車輛、船隻、夫妻。

[Nb] 專有名稱。例:賈寶玉、崔寧、詩經、心宿;張、王、李。

[Nc] 地方名詞。例:蘇州、臨安;府衙、市場、學校、村莊;海外;四海、當地。

Ncd(刪除)

[ Nd] 時間名詞。例:西漢;天寶;辛未;春天;十二月、臘月;六日、冬至;傍 晚、大清早;過去、從前、當初;以後、後來、將來;現在、當今、眼前。

[Neu] 數詞(原Neu):數字和代數字。例:三、幾、好幾、甲。

[Nes] 特指定詞(原Nes):具有特指(Specific)意義的定詞,不能單獨出現,可 以直接修飾名詞。例: 某、該、本、同、第。

[Nep] 指代定詞(原Nep):例:這、那、哪、其、箇。

[Neqa] 數量定詞(原Neqa):除了修飾中心語外,還可出現在論元位置(因中心 語省略)、狀語位置。例:許多、一些。少部分還可當補語。例:她漂亮了 許多

Neqb:(刪除,改歸T7)

[Nf] 量詞。用以計量的連用語位,常和定詞構成定量式詞組。

[Ng] 方位詞。經常前接一個詞組形成時間成分或表情況的成分。例:例:有天 堂;上頭、中間、左方、西北;夜、三百人以上

[Nh] 代詞。「我」「你」「他」;自己;您、足下、令尊(?)、本人、賤內、 小犬;「誰」「什麼」「甚麼」「啥」;之。

[P] 介詞。用以引介一個角色,作動詞的修飾成分或必要論元。

[SHI] 即:是。

[ T ] 語助詞。附加於詞組或句子後的連用詞。.了;.沒、沒有、未、而已、罷了、 也罷、著、來、去;.呀、哇、那、呢、哩、麼、嘔、誒、囉、嘍、吧、罷、 則箇;嗎、否、不、無、與否、哉、耶、矣、啵、云云。

T1(預留類)動詞詞尾:表動貌。如「了」「著」「過」「將」等。

T2.(預留類)「的(底)」「之」:附綴於名詞修飾語的詞。

[T3].「得(的)」:表示可能性的動詞後綴,或作為引介補語的連接詞。如「曉 得」(比較「曉不得」)「打得著」「娶得他起」「吃得口滑」。

[T4].位在描繪情狀的詞語之後的: 如「地(的)」「裏」「價」「也似」「似的」 「一樣」「一般」等。

[T5].可附在從句或狀語後,表示條件、時間、原因等的:「時」「(的)時節」 「的時候兒」「的話」「上」「起見」「來」「以來」。

[T6].位在名詞或名詞組之後,表示複數的:如「們」「等」「等等」「之類」等。

[T7].位在數詞之後的:如表約數或餘數的「來」「餘」「多」。

[T8]「者」「所」:「者」「所」可分析為代詞性的附屬詞。

[VA] 動作不及物動詞。這類動詞只需要一個名詞組參與論元即可。例:跑、飛、 走;坐、躺;上臺、出場;下雨、颳風、打雷;謀生。

[VAC] 作格動詞。論旨角色為客體(theme),動詞前可有一個肇始者(causer),

原來出現在動詞前的客體移到賓語的位置。 例:出動、轉。

[VB] 動作類單賓動詞。語意上需要兩個參與論元,但它的賓語不能直接出現在動 詞後,而以介詞引介或賓語前提的方式出現。例:求婚、拜年;充公、除名。

[VC] 動作單賓動詞。語意上需要兩個參與論元。例:打、學、使用、破壞、照顧; 買、賺、吃、組織、收取、洩露;押送、放、埋、懸掛、儲存、囚禁。

[VCL] 表移動或存在的動詞。主語為客體(theme),賓語為表地方的終點(goal)。 例:進、闖入、經過、逃離、住、世居。

[VD] 雙賓動詞。這類動詞在語意上有傳遞事物的動作訊息,需要三個參與論元。

例:寄、送、捐;搶、索取。

[VE] 動作句賓動詞。後接句賓語的動作及物動詞。例:責問、詢問;許諾、指引: 悲歎、自誇、下令、研究、討論、探索、反省、猜想、說。

[VF] 動作謂賓動詞。後接動詞組賓語的動作及物動詞。例:企圖、想、打算;任 用、勸。

[VG] 分類動詞。擔任主語和補語間連結的角色。例:稱呼、喊、命名;姓、當。

[VH] 狀態不及物動詞。用以描述事物所呈現的狀態,這類動詞只需要一個論元即 可。例:動聽;大、高、慢;瀰漫、矗立;夠、適合;丟、瞎、斷;心酸。

[VHC] 作格動詞。例:辛苦、豐富、穩固;震驚、為難、急煞、感動。

[VI] 狀態類單賓動詞。語意上需要兩個參與論元,但它的賓語不能直接出現在動

詞後,而以介詞引介或賓語提前的方式出現。例:心動、灰心、傾心;內行、

不利、為例;受教、取材、取決。

[VJ] 狀態單賓動詞。這類動詞在語意上需要兩個參與論元。例:迎合、代表;景

仰、惦念、嫌忌;長達、剩餘。

[VK] 狀態句賓動詞。後接句賓語的狀態及物動詞。例:不滿、嫌惡;反應、干係。

[VL] 狀態謂賓動詞。後接動詞組的狀態及物動詞。例:甘願;輪、該;使、讓。

[V_2] 即「有」。


近代漢語詞類說明(據中研院詞庫計劃現代漢語組的「詞類分析總表」修訂)

分類大綱

這裡詞類的分類主要是根據中研院詞庫計劃現代漢語組的「詞類分析總表」再酌予增減而成的。

體詞(N),體詞通常出現在主語或賓語的位置。(依其語意、作用分八類)

動詞

動詞,是述語中心。(依動作/狀態、及物性、論元個數以及動詞後接成分的詞組形式分為十二大類)

非謂形容詞

3. 副詞,主要用作述語的修飾語。

[ I ] 感歎詞。表示說話者的口氣或態度的獨用語式。例:啊、喂、唉。

象聲詞

Angel [A] 非謂形容詞

是純粹的形容詞,不具述語作用,可以修飾名詞或副詞。例:公共、共同。

例句:

[Caa] 並列連接詞(相當原Ca類,但不包括「等」「之類」等)

連接兩個詞性相似的成分形成向心式結構,其中每一個成分的功能都跟整個結構相同。

類連接詞多半同時具有介詞的特性。例:與、和、同、跟。

2.2.關聯連接詞,是能夠把幾個分句連成複句形式的連接詞。(原Cb)(下分二類)

[Cba] 偏正句句尾連接詞。(原Cbab)這一類如「時」「時節」「的時候」和「起見」。

[Cbb] 偏正句連接詞。(下分三類)

1.偏正句移動性連接詞。(原Cbaa)為移動性前繫連接詞,語意上具起頭作用,後面常須接一個分句,其所在分句可能移位至複句的後半段。例:雖然、因為、即使、只有。

2.非移動性前繫連接詞。語意上具起頭作用,後面常須接一個分句,位置固定在前一分句。(原Cbb)(下分兩類)

a.偏正句非移動性前繫連接詞。(原Cbba)例:雖、既、就是。

b.聯合句前繫連接詞。(原Cbbb)例:不但、一來。

3.後繫連接詞,能將一個分句聯繫於前一個句子的連接詞。(原Cbc)(下分兩類)

a.偏正句後繫連接詞。(原Cbca)例;可是、所以、那麼、否則。

b.聯合句後繫連接詞。(原Cbcb)例:而且、二來。

◎若、可中(=如果)

[Daa] 表範圍和數量的副詞。例:就、才、只、光、不過、約、正好、約、僅僅。

◎俱

◎只(止、祇)、單、單單、光、惟

◎又、

[Dab] 表範圍和數量的副詞,不可以直接修飾名詞組。例:都、通、一概、也。

◎都、

◎但

◎也。

[Dba] 法相副詞。(原Dba)

a.推測用法。(原Dbaa)例:也許、大概、可能、一定。

b.義務用法。(原Dbab)例:必須、可以、得。

◎定、一(以、已)定、必、必定、是(事、勢)必、務、務必、須、消、管取。

◎莫、莫是、莫非

[Dbb] 表示說話者的評斷的副詞。例:幸虧、果然。

詞例:

◎難道、豈、不成、終不成、沒地(的、得)、沒地裏、不到(道)得(的、底)。

◎幸、早是、虧不盡

◎果然

◎anyway反正、脫不了(=反正)、高低、好歹、○

◎卻、可(=卻)

例句:

不成日後倒要替你們吃官司!(水滸傳)○沒地裏倒把我撥回陽穀縣去不成!(水滸傳)○押司便誤了些公事,知縣相公不到得便責罰你!(水滸傳)

[Dc] 表否定的副詞。包括:未、沒有、沒、不。

◎別、不、休、沒、別要、沒曾、不曾、莫。

[Dd ] 時間副詞。

例:先、立刻。

時段:

相對的時點:

◎已、已經、早、早(是)、早已。

◎曾、

◎方纔(才)、適纔(才)、適間、剛、剛刪、剛纔(才)、

◎將、將次、行將、方待。

◎正、在、正在。待中

◎常、常常、時、時時、時常、常時、時刻、尋常、通常。再、再三、再四。

◎還、依然、尚然、仍舊、兀自。

◎先

◎一向、向來、從來。

[Dfa] 動詞前程度副詞。例:很、非常。

◎許多、多、多少

◎好、好生、老、怪、煞、極、十分、著實、儘、忒、甚、稍、略略的、、幾可裏(=差不多)、越、越發、較。

[Dfb] 動詞後程度副詞。例:得很、之至、。

◎得慌、之極。

[Dg] 地方副詞。例:處處、到處。

◎一地裏、

[Dh] 方式副詞。例:逐一、從頭、一起。

◎這麼(們)、這等、這般、這樣、恁般、恁樣、如許。

[Di] 標誌副詞。幾乎都緊接在動詞之後,表現時態。例:了、過、著、將(如「走

將出去」的「將」)。(建議此類將來歸在某個T類)

◎了、著、仔(子)、過、將。

例句:

◎走將出去()○

[Dj] 疑問副詞。例:為什麼、幹麼。

◎可、可是、敢、還。

◎怎(爭)、怎地(的)、怎麼、怎生、怎樣、怎麼樣、作什麼、因甚、為甚、

為甚麼、為怎麼、

◎是否、能否、應否、可否、曾否、有無、

[Dk] 句副詞。有轉變或連接語氣的功能。例:總之、據說。

[Dl] 關連副詞:如「也」「又」「就」「便」「才」「卻」等。

這些詞都可能有表示評價的用法(可以視為引伸附帶的功能)。「就」和「才」另有Daa用法。

「也」電子詞典歸入Dbb,這是表示評斷的副詞。但「也」用在如「他吃你也吃」「也有風也有雨」這種句子是很常見的,卻很難看得出有什麼評斷意味。傳統上「也」比較常見的是歸於範圍副詞,因為至少可以說是以述語為其論元。

「又」分別列入Dd和Caa固然也是一法。不過把和時間無關的「又」列入Caa卻不見得理想,因為「又」一般是不放在主語之前的,所以應該列為副詞。如「他又肥又胖」「草兒又長,馬兒又肥」。把「又」放在關連副詞中,可以統合有時間關涉及無時間關涉的兩種用法,而且可以避免歸作連詞的問題。

「就(便)」「才」都可涉及時間,但是只有「就」列了時間副詞Dd的類,其實「才」也有涉及時間的用法。如「他才到」。另外,「就(便)」「才」都有表示條件而和時間無涉的用法,現有體系卻無處可放。如「這樣才對」「這樣就對了」。我們認為,把「就(便)」「才」放在關連副詞中,也可以統合有時間關涉及無時間關涉的兩種用法。

我們把這些詞歸入關連副詞,也是過去有人使用過的辦法。這個歸類法不但可以強調它聯絡句子的特徵,而且可以避免某些歸類上可東可西的困擾。

例句

近代漢語中有些方言的關連副詞可以放在主語之前,用法有如連詞。這樣的用法的條件限制為何,還有待進一步研究。如果單獨使用或與其他副詞合用,我們仍歸作副詞。如:

也就大家不言語了(醒世姻緣)○便事體大不好了(醒世姻緣)○他合了別的學生同(醒世姻緣)○卻又晁源漸覺減了病症(醒世姻緣)

但如果和連詞合用,則視為連詞。如:

況又他處心不善(醒世姻緣)

用於轉折句的「可」的來源可能和「卻」有關,但是用在主語前卻比「卻」為常見。因此歸類為連詞。如:

○你給他,他媳婦見著沒?(醒世姻緣)○他那時腿好,他也不自家賣(醒世姻緣)○

4. [DE] 即:的(底)、之。

近代漢語「底」「得」「地」是三種功能不同的虛詞,但在元明時這三種在語音上已逐漸化約為「的」。的(底)

5. [ I ] 感歎詞。表示說話者的口氣或態度的獨用語式。例:啊、喂、唉。

6. 體詞(N),體詞通常出現在主語或賓語的位置。(依其語意、作用分八類)

6.1. [Na] 名詞。(下分五類)

1.物質名詞,是不可數的實體名詞。(原Naa)例:泥土、鹽、水、牛肉。

2.個體名詞,是可數的實體名詞,可受個體量詞修飾。(原Nab)

例:桌子、杯子、衣服、刀。

3.可數抽象名詞,是可數的非實體名詞。(原Nac)例:夢、話、原因、勾當。

4.抽象名詞,是不可數的非實體名詞。(原Nad)例:風度、香氣、愛心、馬後砲。

5.集合名詞:這類名詞(1)不能指涉個體,只能指涉複數,且(2)不可以受個體量詞修飾,又依是否受定量式複合詞修飾分二類。(原Nae)

(1)不能加任何定量式詞組來修飾的集合名詞。(原Naea)

例:三餐、五臟六腑、四肢。

(2)可用定量式詞組來修飾。(原Naeb)

例:車輛、船隻、夫妻。

6.2. [Nb] 專有名稱。(下分兩類)

1.正式專有名稱,包含時間、地方以外的專有名稱。(原Nba)

例:晁源、賈寶玉、崔寧、詩經、心宿。

2.姓氏。(原Nbc)例:張、王、李。

6.3. [Nc] 地方名詞。(下分四類)

1.專有地方名詞,特指某一地方、行政單位或機構,通常不能用定量式複合詞來修飾。(原Nca)例:蘇州、臨安。

2.普通地方名詞,可以用定量式詞組來修飾。(原Ncb)

例:府衙、市場、學校、村莊。

3.名方式地方名詞。例:海外、身上、腳下。(原Ncc)

4.定名式地方名詞。(原Nce)例:四海、當地。

Ncd(刪除)

6.4. [ Nd] 時間名詞。(下分三類)

1.時間名稱(原Nda)(下分兩類)

(1)歷史性的時間名稱(原Ndaa)(下分四小類)

a.特指的時代名稱。(原Ndaaa)例:洪荒時代。

b.朝代名稱。(原Ndaab)例:唐朝、西漢。

c.歷代帝王的年號名稱。(原Ndaac)例:乾隆、光緒、天寶。

d.年份名,用以計數年份的紀元。(原Ndaad)例:公元、西元。

(2)可循環重複的時間名稱(原Ndab)(下分六小類)

a.年稱。(原Ndaba)例:今年是「辛未」年。

b.季節,即春、夏、秋、冬四季。(原Ndabb)例:今年「春天」雨水多。

c.月份名稱。(原Ndabc)例:「十二月」又叫「臘月」。

d.日期。(原Ndabd)例:三月「六日」、冬至。

e.日以內的時間名稱。(原Ndabe)例:傍晚、大清早。

f.時期,指一段時間。(原Ndabf)例:年假、春節。

2.名方式時間名詞,由附著語位的時間成分加上方位詞複合而成。(原Ndc)

例:年底、週末、日後。

3.副詞性時間詞(原Ndd)(以下分三類)

(1)表過去的副詞性時間詞。(原Ndca)例:過去、從前、當初。

(2)表將來的副詞性時間詞。(原Ndcb)例:以後、後來、將來。

(3)表現在及其他的副詞性時間詞。(原Ndcc)例:現在、當今、眼前、近來、適纔(才)、適間、恰纔(才)。

6.5. 定詞(原Ne),用以表示物品的指涉或物品的數量。依語意和語法特性,細 分為以下五類:

[Neu] 數詞定詞(原Neu):純數字、及序數數詞,例:三、百、幾、好幾、甲。

[Nes] 特指定詞(原Nes):具有特指(Specific)意義的定詞,不能單獨出現,可以直接修飾名詞。例: 某、該、本、同、第。前、後、上。前一日、前一回、上回。

[Nep] 指代定詞(原Nep):除了定語,另有代詞功能。例:這、那、哪、什麼、啥、其、箇。

[Neqa] 數量定詞(原Neqa):除了修飾中心語外,還可出現在論元位置(因中心語省略)、狀語位置(主語和謂詞之間)。例:許多、百分之五十、三分之一、五成三。

少部分還可當補語。例:她漂亮了許多

[Neqb] 後置數量定詞(原Neqb):嚴格說,這類詞並不符合定詞的定義,只是它的用法都接在量詞之後,暫時將它們放在此類。

例:三點、五十歲出頭、兩丈

6.6. [Nf] 量詞。用以計量的連用語位,常和定詞構成定量式詞組。

1.個體量詞,表示每一個名詞所屬的專門單位詞。(原Nfa)

例:一「張」桌子、一「個」杯子、一「件」衣服、一「把」刀子。

2.跟述賓式合用的量詞,放於動詞與賓語之間。(原Nfb)

例:下一「盤」棋、寫一「手」好字、說一「口」標準國語。

3.群體量詞,語義上能標示出一組或一群的物體。(原Nfc)

例:一「對」夫妻、一「雙」筷子、一「副」耳環、一「群」鴨子。

4.部分量詞,表示事物的部分而非整體的概念。(原Nfd )

例:一「部分」原因、一「節」甘蔗、一「段」文章、一「些」事情。

5.容器量詞,用器皿式的名詞來作量詞,表示概括性的容量。(原Nfe)

例:一「箱」書、一「櫃子」衣服、一「盤」水梨、一「碗」飯。

6.暫時量詞,是以名詞作量詞,加在定詞後面。(原Nff)

例:一「肚子」牢騷、一「頭」秀髮、一「鼻子」灰、一「地」落葉。

7.標準量詞,是正規的量詞,為名副其實的量詞。(原Nfg )包括:

長度單位。例:尺、寸、丈。

面積單位。例:頃、畝。

重量單位。例:斤、兩。

容量單位。例:升、斗。

時間單位。例:分、時、刻。

錢幣單位。例:錢、兩。

數量單位。例:刀、令。

能量單位。例:馬、牛、炬。

8.準量詞,由名詞轉化而來的單位化量詞,是獨立自主的,它不是後頭名詞的量詞。(原Nfh)例:國、面、撇。

9.動詞用量詞,是動作動詞的量詞,表示動作發生的次數。(原Nfi)

例:看一「遍」、摸一「下」。

6.7. [Ng] 後置詞。它是一個附著成分,前接一個詞組形成時間成分或表情況的成分。例:睡覺「之前」、夜「裡」、三百人「以上」。

表事物相對位置的地方詞。大部分由獨用的方位詞或方方式或定方式複合詞構成 (下分二小類)。(原Ncd

1.單音節位置詞,其後不能加「的」。(原Ncda)例:「上」有天堂。

2.雙音節位置詞。(原Ncdb)例:上頭、中間、左方、西北。

6.8. [Nh] 代名詞。(下分三類)

1.人稱代名詞(原Nha)(下分三小類)

(1)常用的人稱代名詞,是「我」「你」「他」及其複數式、同義詞。(原Nhaa)

◎「我」「俺」「咱」「你」「恁」「他」「我們(每)」「咱們」「你們(每)」「他們(每)」。

(2)一般的人稱代名詞,可與第一、二、三人稱同位並列。(原Nhab)例:自己。

◎自家、自己、別、別人、大家。

(3)特別的人稱代名詞,有所專指的代名詞。(原Nhac)

例:您、足下、令尊、本人、賤內、小犬。

2.疑問代名詞,包括「誰」「什麼」及其別體「甚麼」「啥」等。(原Nhb)

3.泛指代名詞,可通用於人、物的代名詞。(原Nhc)例:之、其。

7. [P] 介詞。用以引介一個角色,作動詞的修飾成分或必要論元。(依介詞組所可能表示的角色、介詞對其論元之語意及語法限制的不同分為六十五類)

◎把、將、拿。

◎被、叫(教)、著、使、喫、把、與。

◎似、如、起、過。

◎與、和、合、同、連。

◎for 與、合、替。

◎在

◎到

◎、向、就、對著、去、。

◎從、打、打從、自從、自。

8. [SHI] 即:是、係、為。

9. [ T ] 語助詞。附加於詞組或句子後的連用詞。(依語助詞間共存的次序分為四類)

1.了。(原Ta)

2.沒、沒有、而已、罷了、也好、也罷、云云、等等、之類、爾爾、著、來。(原Tb)

3.啊、呀、哇、哪、吶、呢、哩、喲、唷、嘛、嚜、麼、哦、喔、嘔、誒、耶、 囉、嘍、吧、罷、啦、咧、則箇。(原Tc)

4.了麼、了否、而已嗎、啦云云、咧云云、嗎、否、不、與否、哉、耶、矣、 啵。(原Td)

  如果有一個以上的語助詞一起出現,其先後的順序依序為:Ta,Tb,Tc。Td 不與前三類共存。

◎了、麼(摩、無、否、沒)、呢、哩(俚、里、裏)、咱、則箇、著、休、來、來著、去、罷、罷了、也、呀(啞)、那、哇、喲、囉、嘍、啦、哉、來哩、罷麼、罷呢、罷呀、哩麼、云云、爾爾。

T1(預留類)動詞詞尾:表動貌。如「了」「著」「過」「將」等。

T2.(預留類)「的(底)」「之」:附綴於名詞修飾語的詞。

[T3].「得(的)」:表示可能性的動詞後綴,或作為引介補語的連接詞。如「曉 得」(比較「曉不得」)「打得著」「娶得他起」「吃得口滑」。

[T4].位在描繪情狀的詞語之後的: 如「地(的)」「裏」「價」「也似」「似的」 「一樣」「一般」等。

[T5].可附在從句或狀語後,表示條件、時間、原因等的:「時」「(的)時節」 「的時候兒」「的話」「上」「起見」「來」「以來」。

◎若發了病的時侯兒,拏出來吃一丸。(紅樓夢)

[T6].位在名詞或名詞組之後,表示複數的:如「們」「等」「等等」「之類」等。

[T7].位在數詞之後的:如表約數或餘數的「來」「餘」「多」。

[T8]「者」「所」:「者」「所」可分析為代詞性的附屬詞。

10. 動詞,是述語中心。(依動作/狀態、及物性、論元個數以及動詞後接成分的詞組形式分為十二大類)

[VA] 動作不及物動詞。這類動詞只需要一個名詞組參與論元即可。(依論旨角色、語意特性的不同分為三類)

1.表移動或存在的動詞,論旨角色為客體(theme)。(原VA1)(依語意及內部結構的不同分為三類)

(1)表移動或行動的動詞,可後接地方成分,有主語倒置的現象。(原VA11)

例:跑、飛、走。

(2)表存在或靜態的動詞,可後接地方成分,有主語倒置的現象。(原VA12)

例:坐、躺。

(3)內部結構為述賓結構且賓語為表地方成分的行動動詞。(原VA13)

例:逛街、上臺、出場。

2.氣象動詞,論旨角色為客體(theme)。(原VA3)

例:下雨、颳風、打雷。

3.一般的動態動詞,論旨角色為主事者(agent)。(原VA4)

例:違規、謀生、開會。

[VAC] 作格動詞。論旨角色為客體(theme),動詞前可有一個肇始者(causer),

原來出現在動詞前的客體移到賓語的位置。(原VA2) 例:出動、轉。

[VB] 動作類單賓動詞。語意上需要兩個參與論元,但它的賓語不能直接出現在動詞後,而以介詞引介或賓語前提的方式出現。(依論旨角色的不同分為兩類)

1.賓語為動作施行的對象,其角色為終點(goal)。(原VB1)(依句型的不同分為兩類)

(1)終點一定要以介詞引介出現在動詞前或後。(原VB11)例:求婚、拜年。

(2)終點可以是名詞組出現在主語位置。(原VB12)例:立案、整容、解體。

2.賓語的角色為客體(theme)。(原VB2)例:充公、除名、送醫。

[VC] 動作單賓動詞。語意上需要兩個參與論元。(依論旨角色的不同分為三類)

1.以主事者(agent)為主語,終點(goal)為賓語。(原VC2)

例:打、學、訪問、使用、破壞、照顧。

2.以主事者(agent)為主語,客體(theme)為賓語。(原VC3)(依句型的不同分為三類)

(1)動詞後除了賓語外不需再接一個地方成分。(原VC31)

例:買、賺、吃、生產、組織、收取、洩露。

(2)動詞後除了賓語外,通常還接一個由介詞「到」引介的地方詞。(原VC32)

例:走私、引渡、調遣、押送、發射、搭載。

(3)動詞後除了賓語外,通常還接一個由介詞「在」或「到」引介的地方詞,而且有地方詞倒置的現象。(原VC33)

例:放、埋、懸掛、儲存、搭建、囚禁。

[VCL] 表移動或存在的動詞。主語為客體(theme),賓語為表地方的終點(goal)。(原VC1)例:進、闖入、經過、逃離、住、世居。

[VD] 雙賓動詞。這類動詞在語意上有傳遞事物的動作訊息,需要三個參與論元。(依間接賓語的論旨角色的不同分為兩類)

1.表將一事物傳遞給對方的動詞,主事者(agent)具有起點特徵(+source),間接賓語是終點(goal)。(原VD1)例:寄、送、捐。

2.表向對方取得一事物,主事者(agent)具有終點的特徵(+goal),間接賓語是起點(source)。(原VD2)例:搶、敲詐、索取。

[VE] 動作句賓動詞。後接句賓語的動作及物動詞。(依論元個數的不同分為兩類)

1.三元動詞。(原VE1)(依語意上的不同分為「問類」及「說類」兩類)

(1)問類(原VE11),以主事者(agent)為主語,以終點(goal)為間接賓語,客體(theme)為直接賓語 (句賓語),句賓語為疑問句式,且疑問範圍只到包接句。 例:責問、詢問。

(2)說類(原VE12),和VE11的論旨角色相同,不同的是:

a. VE12的句賓語不限於疑問句。

b.句賓語的疑問範圍不限於包接句。

c.主語或間接賓語與句賓語之主語間可有共指關係。

例:提示、許諾、指引。

2.二元動詞,以主事者(agent)為主語,終點(goal)為句賓語,語意多為表語言行為之動詞。(原VE2)

例:悲歎、自誇、下令、研究、討論、探索、反省、強調、猜想、說、提到。

[VF] 動作謂賓動詞。後接動詞組賓語的動作及物動詞。(依論元個數的不同分為兩類)

1.二元動詞,以主事者(agent)為主語,終點(goal)為賓語,語意多含有「打算」之意。(原VF1)

例:企圖、想、打算。

2.三元動詞,以主事者(agent)為主語,後帶一個終點(goal)的名詞組賓語,再帶一個表客體(theme)的動詞組賓語。其中這個名詞不但是主要動詞的賓語,也是動詞組賓語的主語,是一般所謂的「兼語式」動詞,此類動詞語意多表「鼓勵」、「命令」、「強迫」、「請求」。(原VF2)

例:任用、勸。

[VG] 分類動詞。擔任主語和補語間連結的角色。(依論元個數的不同分為兩類)

1.三元動詞,這類動詞帶有主事者(agent)、客體(theme)和範圍(range)三個論元。(原VG1)

例:稱呼、喊、命名。

2.二元動詞,典型的分類動詞,帶客體(theme)和範圍(range)兩個論元。(原VG2)例:姓、當。

[VH] 狀態不及物動詞。用以描述事物所呈現的某種狀態,這類動詞只需要一個參與論元即可。(依論旨角色的不同分為兩大類)

1.論旨角色為客體(theme)。(原VH1)(依句型的不同分為六類)

(1)一般的不及物動詞。(原VH11)例:動聽、浪漫、特別。

(2)能夠後接定量詞表示量度的動詞。(原VH12)例:入超、增值、淨重。

(3)能夠後接比較對象及兩者差額的動詞。(原VH13)例:大、高、慢。

(4)可以後接地方成分,有地方詞倒置句型。(原VH14)例:瀰漫、矗立。

(5)可以以句子作為主語,且可將句子移至動詞後。(原VH15)例:值得、夠、適合。

(6)動詞前可有一個接受者(recipient),是客體(theme)的擁有者。(原VH17)例:丟、瞎、斷。

2.論旨角色為經驗者(experiencer)。(原VH2)

(1)非作格動詞。(原VH21)例:心酸、想不開。

[VHC] 作格動詞。又可分兩類:

1.作格動詞,動詞前可有一個肇始者(causer),原來動詞前的客體(theme)移到一般賓語的位置。(原VH16)例:辛苦、豐富、穩固。

2.作格動詞,動詞前可有一個肇始者(causer),原來動詞前的經驗者(experiencer)移到賓語的位置。(原VH22)例:震驚、為難、急煞、感動。

y[VI] 狀態類單賓動詞。語意上需要兩個參與論元,但它的賓語不能直接出現在動詞後,而以介詞引介或賓語提前的方式出現。(依論旨角色的不同分為三類)

1.以經驗者(experiencer)為主語,終點(goal)為賓語,表心靈狀態。

(原VI1)例:心動、灰心、傾心。

2.以客體(theme)為主語,以終點(goal)為賓語。(原VI2)

例:內行、不利、為例。

3.以客體(theme)為主語,以起點(source)為賓語。(原VI3)

例:受教、取材、取決。

[VJ] 狀態單賓動詞。這類動詞在語意上需要兩個參與論元。(依論旨角色不同分為三類)

1.以客體(theme)為主語,以終點(goal)為賓語。(原VJ1)

例:迎合、代表。

2.以經驗者(experiencer)為主語,終點(goal)為賓語,表心靈狀態。(原VJ2)例:景仰、惦念、嫌忌。

3.以客體(theme)為主語,以範圍(range)為賓語。(原VJ3)

例:長達、剩餘。

[VK] 狀態句賓動詞。後接句賓語的狀態及物動詞。(依照主語論旨角色的不同分為兩類)

1.以經驗者(experiencer)為主語,以終點(goal)為賓語,表心靈狀態。(原VK1) 例:不滿、嫌惡。

2.以客體(theme)為主語,以終點(goal)為賓語。(原VK2)

例:反應、在於、干係。

[VL] 狀態謂賓動詞。後接動詞組的狀態及物動詞。(依照主語論旨角色或論元個數的不同分為四類)

1.以經驗者(experiencer)為主語,終點(goal)為賓語的二元動詞,表心靈狀態而其語意多表「意願」。(原VL1)例:樂於、甘願。

2.以客體(theme)為主語,終點(goal)為賓語的二元動詞。其語意多表「專門」之意。(原VL2)例:擅長、專門、擅於。

3.不帶主語的二元動詞,後接一個終點(goal)和一個表客體(theme)的動詞組論元。(原VL3)例:輪、該。 其中表客體的動詞組中賓語部分常常會移到輪、該等主要動詞前面的位置。

4.使役動詞,帶肇始者(causer)、終點(goal)、客體角色(theme)的三元動詞。(原VL4)例:使、讓。

[V_2] 即「有」。

表﹑中研院詞庫近代漢語詞類標記集

簡化標記

對應的CKIP詞類標記[1]

A

A

/*非謂形容詞*/

Caa

Caa

/*對等連接詞,如:和、跟*/

Cab

Cab

/*連接詞,如:等等*/

Cba

Cbab

/*連接詞,如:的話*/

Cbb

Cbaa, Cbba, Cbbb, Cbca, Cbcb

/*關聯連接詞*/

Da

Daa

/*數量副詞*/

Dfa

Dfa

/*動詞前程度副詞*/

Dfb

Dfb

/*動詞後程度副詞*/

Di

Di

/*時態標記*/

Dk

Dk

/*句副詞*/

D

Dab, Dbaa, Dbab, Dbb, Dbc, Dc, Dd, Dg, Dh, Dj

/*副詞*/

Na

Naa, Nab, Nac, Nad, Naea, Naeb

/*普通名詞*/

Nb

Nba, Nbc

/*專有名稱*/

Nc

Nca, Ncb, Ncc, Nce

/*地方詞*/

Ncd

Ncda, Ncdb

/*位置詞*/

Nd

Ndaa, Ndab, Ndc, Ndd

/*時間詞*/

Neu

Neu

/*數詞定詞*/.

Nes

Nes

/*特指定詞*/

Nep

Nep

/*指代定詞*/

Neqa

Neqa

/*數量定詞*/

Neqb

Neqb

/*後置數量定詞*/

Nf

Nfa, Nfb, Nfc, Nfd, Nfe, Nfg, Nfh, Nfi

/*量詞*/

Ng

Ng

/*後置詞*/

Nh

Nhaa, Nhab, Nhac, Nhb, Nhc

/*代名詞*/

I

I

/*感嘆詞*/

P

P*

/*介詞*/

T

Ta, Tb, Tc, Td

/*語助詞*/

VA

VA11,12,13,VA3,VA4

/*動作不及物動詞*/

VAC

VA2

/*動作使動動詞*/

VB

VB11,12,VB2

/*動作類及物動詞*/

VC

VC2, VC31,32,33

/*動作及物動詞*/

VCL

VC1

/*動作接地方賓語動詞*/

VD

VD1, VD2

/*雙賓動詞*/

VE

VE11, VE12, VE2

/*動作句賓動詞*/

VF

VF1, VF2

/*動作謂賓動詞*/

VG

VG1, VG2

/*分類動詞*/

VH

VH11,12,13,14,15,17,VH21

/*狀態不及物動詞*/

VHC

VH16, VH22

/*狀態使動動詞/

VI

VI1,2,3

/*狀態類及物動詞*/

VJ

VJ1,2,3

/*狀態及物動詞*/

VK

VK1,2

/*狀態句賓動詞*/

VL

VL1,2,3,4

/*狀態謂賓動詞*/

V_2

V_2

/*有*/

DE

/*的, 之, 得, 地*/

SHI

/*是*/

FW

/*外文標記*/


[1] 斜體詞類,表示在技術報告#93-05中沒有定義,即後來增列的。

No comments: