Home E-C Dict C-E Dict Online Tools Recipe
Mirror page from PKU

《现代汉语语法信息词典》技术报告之二        

 

现代汉语量词与名词的子类划分              

 

撰稿  朱学锋  王惠

                          审阅  俞士汶

 

关键词:现代汉语、词类、名词子类、量词子类

 

. 前 言

 

    划分词类的目的是把语法功能相同或相近的词归在一起, 以便更详细地描述汉语词语的语法信息。这样归并的结果,同类的词必然有共同的语法功能。 例如: 名词一般都能受数量词或数量结构修饰, : 一头毛驴, 三支笔, 两种产品, 一堆棉花, 三吨煤, ……。但也有少量名词, 它不能受任何数量词或数量结构的修饰, :安危, 太空, 歧途, ……。这说明名词在能不能受数量词或数量结构修饰上有区别, 能受什么样的数量词修饰也有区别。又如:量词, 有的量词只计量动作或动作变化; 有的量词只计量时间;  有的量词只计量事物, 这里面还可细分: 有的只计量个体, 有的只计量群体, 有的只计量种类, ……。也就是说各自计量的对象是不一样的。所以, 大类之下可以再分小类即将同一类词的词语再按语法功能和搭配关系归成不同个性的小类, 这样一来, 描述每一个词语的信息就可以更丰富, 对它们的刻画也就更深刻。同时也为研究短语和短语结构打下了基础。

    我们对量词、名词、动词、形容词等十七类词的子类进行了不同程度的研究[1]。本报告介绍量词和名词子类的划分问题。

 

. 量词子类

 

    量词是表示事物或动作或动作持续时间的数量单位。它是粘着词, 前面必须有数词或指示代词。量词如何划分类, 各家的语法书的观点都不相同, 例如:有的分成七类[2], 有的分成两类[5],有的分成八类[3], 有的分成三类[4], 各家都有自己的道理。本文的重点是谈我们对量词子类的设置和各子类的特点; 并简要介绍一下对于大多数语法书上都有的一些非专用量词, : 临时量词, 准量词等, 我们是如何处理的。

    量词子类分成三大类,即动量词、时量词、名量词。名量词又分为: 个体量词、 集体量词、度量词、容器量词、成形量词、倍率量词、种类量词、不定量词、复合量词。一共分成十一类。量词子类、代码及例子见附录。下面逐一介绍:

1. 动量词

    动量词是表示动作或变化次数的单位。一般语法书上又把它分成两类, 一类是专用动量词,:次、遍、场、顿、趟、……,另一类是借用动量词,:“打一拳”,“放一枪”、“看一眼”……中的“拳、枪、眼”是借用动量词。

2. 时量词

    时量词是动作的发生时间或延续时间的计量单位, : ,,,秒……。

3. 个体量词

    个体量词用于个体事物,与英语相比这是汉语特有的。日语虽也有概念相似的这类词,但用法很不一样,所以日语语法通常将量词归于名词。 个体名词一般都有自己特定的个体量词,少数个体名词只有一个个体量词与它相对应。 大部分个体名词则有几个特定的个体量词与它相对应,:“一把伞”,“一本书”,“一位教授”,“一头羊”,“一匹马”等等。“伞”只能用“把”度量, “马”只能用“匹”度量, “书”能用“本”还能用“册”度量,“教授”能用“位”还能用“名”、“个”度量,当然使用的场合是有区别的。在此特别要提出一点,“个”肯定是个体量词。但现在“个”用得很滥,为了使语言规范化, 不该用“个”来计量的名词, 电子词典一律不填。我们主张只说“一匹马,一头牛”。 什么样的名词用什么量词是约定俗成的, 凡是常用的,应尽可能全部填上。

4. 集合量词

    集合量词本身包含数量, 用于成双、成对、成群的人或事物。如:一双鞋, 一对情人,一群狼, 一批军火等等中的“双、对、群、批”,它们都表示“一”以上的数量。

5. 度量词

    度量词即度量衡的计量单位。如:公斤、米、吨、里、元、千瓦、……。

6. 容器量词

    容器量词是容积的计量单位。多数容器量词是由名词兼的, :“包,,壶”等。 另外, 还有一部分是由名词性语素兼的。如:“盘,,箱”,它们后面必需加后缀才能成为名词, :“盘儿, 箱子,桌子”, 而作为量词时可直接受数词修饰, :“三盘菜”,  “两桌酒”, “三箱书”。

7. 种类量词

    种类量词是用于区分事物的种类、等次。如“两种麦子, 五门功课, 二等舱, 六级台风”中的“种,,,级”。前面两个例子是表示种类, 后面两个例子是表示等次。

8. 成形量词

    成形量词是粗略的描绘物体的一种形状, 借此作为计量单位,:一段路, 两堵墙, 一道光, 一股青烟,……, 其中有一部分成形量词是动词兼的。如:一摊水, 一卷行李, 两堆棉花,……, 其中的“摊”,“卷”,“堆”就是动词兼的。

9. 倍率量词

    倍率量词是说明分量占总数量的多少。这类词很少, : 三分,七成, 五倍中的“分,,倍”。

10. 不定量词

    不定量词表示的量不定,:,点儿,,它们的特点是这些词前面只能加数词“一”,:一点,一点儿,一些。“点儿”表示少量, “点”重叠即“一点点”是强调少量。“些”表示复数或少量。在语感上“些”表示的量要比“点儿”多。要注意不定量词“点”与名词“点”的区分。

11. 复合量词

    复合量词是由两个量词构成, 表示一个复合性单位的量词, 例如:架次,人年,辆次,台次,吨公里,……。它们和其它量词一样能直接受数词修饰,:三百架次, 四百人次等。

    有的语法书上把准量词、临时量词作为两个小类。我们没有单列这些内容。原因是: 1)准量词既有名词的特点,又有量词的特点,它可以直接跟数词组合。例如:“五个省”,“三个县”,“一个站”中的“省,,站”显然是名词, 但我们还可以说“五省青年”,“三县人民”,“一站路”, 这时“省,,站”在数词后边, 名词前面, 与量词的功能、 位置相同,“省,,站”称为准量词, 2)临时量词是部分名词可以表示容量范围, 常借用为量词。如:“一书架书”,“两桌子酒”, “一头泥”, “一肚子委屈”, ……。  上面例子中的“书架”,“桌子”,“头”,“肚子”,它们充当了量词的角色。

    从上面的分析中我们知道无论是准量词或临时量词,它们是名词,具有名词特点, 所以我们在名词库内用属性描述的方法说明该名词具有量词的特点, 即设立字段“临量”。将少数名词能临时借用作量词, 而且只能受数词“一”修饰, 后面可以带“的”表示“满”的意思, 则在这一字段内填“一”, 可以受“一”以外的数词修饰的填“量”, 不能做临时量词的不填。将名词库这个字段节录如下:

 

词 语

临量

备注

一脸(的)杀气

肚子

一肚子(的) 杀气

一嘴(的)油

三省人民

五站路

仿宋

 

 

农药

 

 

 

否则, 在名词库内有这些词, 在量词库内又有这些词。这样处理的结果,避免了信息冗余。

    以上对量词的十一个子类进行了介绍并列举了一些例子。 对大量的词进行归类时,还会遇到这样那样的问题。原因是:1)量词的语义既是准确的,但有时又是模糊的,例如:“三道题目”和“天空中出现了两道白光”; “两把菜刀”和“一把韭菜”。  这两组句子中“三道题目”和“两把菜刀”里的“道”和“把”意思很明确。可是“两道白光”、“一把韭菜”里的“道”和“把”给人的印象却是模糊的。说不清怎样算一“道”, 也说不清多少算一“把”。 2)量词语义往往多义, 而且有交叉和引申,  同一个量词和不同的名词组合时表现出的语义特征不同, 例如: 一口猪和一口井;八级台阶和八级地震、八级厨师。3)同一个量词与不同的名词搭配其意义也有差异。例如:“副”,“一副眼镜”, “一副担架”虽然用了副这个集合量词, 但是指的是一件东西。一副手套指的是两只手套, 一副扑克牌指的是54张牌。

    以上列举的例子都是客观存在的。对绝大多数量词按照个体量词、集合量词、种类量词等进行功能归类。 对于极少数量词, 允许它跨类。 利用这个办法来解决上面提出的矛盾。“一道题目”的“道”是个体量词,“一道白光”的“道”是成形量词,“一把韭菜”的“把”是成形量词, “两把刀”的“把”是个体量词, “八级台阶”的“级”是个体量词, “八级地震”或“八级厨师”的“级”是种类量词, “一副眼镜”或“一副担架”的“副”是个体量词。 “一副手套”或“一副扑克牌”的“副”是集合量词,  目前一共用了213个常用量词, 其中有13个量词跨两个小类。

 

. 名词子类

 

    这里名词子类的划分是为了研究其语法功能,而不是研究语义,因此, 不能根据语义划分子类。我们利用名词与不同量词的搭配关系将名词子类分成了八类, 下图是名词子类划分及其代码:

                                                       可数    a

                                                计量

                                                       不可数  b

                                        具体

                                                       可分    c

                                普通            集合

                                                       不可分  d

 

             能与名量词搭配             种类                   e

 

                                专有                           f

    名词

             只能与动量或时量词搭配                            g

 

             无量                                              h

 

图一. 名词子类划分及其代码

 

下面对各子类分别进行说明:

1. 可数个体名词

    这类名词的特点是有自己专用的个体量词。参见本文二.3节。

2. 不可数物质名词

    表示一种物质。该物质不能用个体量词来计数, 只能用度量词或容器量词来度量。这是判别这类词的主要依据。当然有时也可以用成形量词或不定量词或种类量词来度量, 往往不只一种度量方式。例如:“大米”可以说“煮了一斤大米” ,“运来了三十吨大米”,“运走了一车大米”,“卖了两包大米”,“买了一袋大米”,“这一种大米好吃”,“掉了好些大米”等等。举了上面这些例子,都是生活中常用的,不会有争议。但是在口语中有时也说:“一粒大米”或“两粒大米”。 但是这种用法太少了, 谁都不会以粒为单位去数大米,我们认为“大米”划为不可数物质名词更妥当。又如“稻草”它可以用斤、公斤、吨、车、堆、捆、点、些来度量。这些量词是我们填写的。也可能有人说,“稻草烧光了,柴房里一根稻草也没有了”, 说话人是为了强调稻草烧完了,实际上也不一定一根都没有了,平时不会用“根”来度量“稻草”,所以电子词典内没有填写“根”这一量词。

3. 可分集合名词

    表示集合,描述成群成组的事物,但此类事物又可以个体化。这类名词可用集合量词计数, 同时也可以用除“一”以外的个体量词计数。例如“师生”原意是指老师和学生, 可以说“来了三位北大师生”, 也可以说“一群师生”, 但不能说“一个师生”。“兄妹”、“姐妹”、“妯娌”都属于这一类词。应注意,有部分词原意是表示集合,但现在词意有所变化。例如“图书”原指图画和书,现在泛指书籍, 如“北大图书馆珍藏了几百万册图书”,也可以说“我今天借了一本图书”。 本、册是个体量词,“图书”是能受个体量词修饰的名词, 所以是个体名词, 而不是可分集合名词。

4. 不可分集合名词

    表示集合,描述成群成组的事物, 但该事物不可以个体化, 即不受个体量词修饰。 除了可用集合量词修饰之外, 有时还可以受容器量词、度量词或不定量词修饰。 例如 “船舶”、“军火”、“钱粮”、……,“船舶”按照词典的解释是船的总称。船是个体名词,可以受一条、一只、一艘修饰, 但“船舶”却不能与这些个体量词搭配。例如可以说“上海港停靠了很多船舶”, 但不能说“上海港停靠了一条(,)船舶”。 又如“军火”它是武器和弹药的总称。没有专用的个体量词修饰它,但有可用的集合量词, :一批军火。同时也可以用容器量词、度量词和不定量词度量, 如“一车军火”、“三吨军火”。所以“船舶”、“军火”这一类的词为不可分集合名词。

    划分这一类的词还应注意两点:(1)不能只从字面上看, 好象表示集合就认为它是集合名词, 如“砂岩”它是岩石的一种,不是指砂和岩石。又如“砂纸”,它是由玻璃粉粘在纸上制造而成。我们认为它是一个整体, 是一种物体。可以用个体量词“张”来数, 如“我买了三张砂纸”,所以“砂纸”不是集合名词, 而是个体名词。(2)从字面上看确实是表集合, 指的是成群成组的事物, 但它不属于集合名词。例如“双方”,“祖孙” ,“寝食”,“水土”,“渔猎”,“公婆”,“视听”,“身心”,“父子”,……。使用这些词时, 说话人的意思只希望说明一个事实。 如“双方受益”,“水土肥沃”,“身心健康”,“公婆健在”,“以渔猎为生”,“父子关系很好”,……。这类词的重要特点是:它们不受任何数量词或数量结构修饰, 所以它属于无量名词。

5. 种类名词

    这类名词的特点是,只受种类量词修饰, 少量的能兼受成形量词或不定量词修饰,不受个体量词修饰,也不受集体量词、度量词和容器量词修饰。见下表词例:

 

词语

种类量词

不定量词

成形量词

    

音乐

点儿

 

这两种~她都很喜爱/他懂一点儿~        

潮流

 

 

这是一种~                            

方式

 

 

这两种~都可以                        

感觉

点儿 

 

我有一种~,明天很可能会下雨/有一点儿~

外文

种,门

点儿

 

他精通八种~/他一点儿~都不会          

学问

种,门

点儿

 

这是一门~/这人一点儿~也没有          

6. 无量名词

    这类词的特点是不能受任何数量词或数量结构直接修饰。例如: 纵深,总支出 ,爱憎,傲骨, 壮志, 重地, 性别, 仁义, ……。无量名词较好判别。但语言有时不规范, 能与不能受数量结构修饰往往难以分清。 例如:“总支出”,  一般用法是“总支出 300万元”,300万元的总支出”,  但也有人说“上月300万元总支出”。 又如: “储藏量”一般说“储藏量是3亿吨”, 但也有人说“3亿吨储藏量”。我们认为词典信息应当填规范化的用法, 偶而有人用或特殊情况下用,这样的信息最好不填入词典。

7. 专有名词

    这一类名词指的是世界上独一无二的事物。例如: 中国,美国,黄山,苏伊士运河,孙中山,尼克松,……。从例子中可以看出这一类词大部分指的是国名,地名,人名等, 因为指的是独一无二的事物,所以一般不会用数量词去修饰。但有时在特殊场合下,  说话人为了强调某一点,在这类词前面加上数量结构也是可能的。例如“中国有两条长江就好了”,如“北京要有一座黄山就好了”。在语法电子词典中, 民族名称如“汉族, 维吾尔族”等也归入了专有名词。

8. 只能与动量或时量词搭配的名词

    这类名词的特点是,只受动量词或时量词修饰, 不受名量词修饰。词例如下:

 

词语

动量词

时量词

名量词

     

大战

,

 

 

一场~/三次~

大火

,

 

 

一场~/本村三年发生了两次~

暴雨

 

 

两场~

内战

,

 

两年~/三次~

灾荒

 

闹过两场~/两年~

灾难

,

 

 

一场~

风暴

 

 

一场~                      

雷声

 

 

响了几阵~                  

为了便于名词子类的划分, 笔者提供了下面的流程图:

图二. 名词子类划分流程图

    我们对数以万计的名词进行了子类划分的实践。据统计约94% 左右的词语比较容易归类, 6%左右的词语归类很费斟酌, 其中1%左右的词语虽然暂时归了类, 可能还有问题。费斟酌或难定的原因及词例如下:

    (1) 有少量的词语,意思大家大致知道,但这些词语已经不大用了, 它能不能受量词修饰或受什么样的量词修饰说不清,一时也很难查证。例如:“衣钵”原指佛教中师父传授给徒弟的袈裟和钵。现泛指传授下来的思想、学术、技能等。如“衣钵相传”。我们按照泛指的意思,即现在常用的情况,子类应归为无量名词。袈裟指衣服,当然可以按照件来计数,钵是指钵盂即古代和尚用的饭碗。饭碗可以用个、只计数。那么“衣钵”是否能按套来计数呢? 又如“生肖”,现在人们一般知道,12种动物即属相来计算人的年龄。“生肖”代表十二地支。这个词一般已经不大用了,而它能不能受“个”来修饰,这是个疑问。

    (2)有的词语表面上同一结构类型(意思不同)好像可以参照着归类,但进一步考查各个词语的用法,它们之间往往是有区别的, 不能照猫画虎。如“群山”与“群岛”。 “中国南海海域有四个群岛”这可以说。但“群山”不受数量词修饰。一般用于“群山环绕”或“群山环抱”,不能说“三个群山”;又如“兄妹”与“父子”, 这两个词语分别表示人与人之间的关系。但“兄妹”可以说“他们家三个兄妹关系很好”。但“父子”只能说“他们父子三人”,它不受任何数量词修饰。所以“群山”,“父子”是无量名词, “群岛”是个体名词,“兄妹”是可分集合名词。

    (3)所填的信息除了合理以外还应该是常用的

    例如“雨水” (表示季节的“雨水”是时间词)常用于“雨水调和”, “雨水充足”,“雨水很少”,……,另外口语中有时也说“接了一桶雨水”,“接了两盆雨水”, ……。如果在度量词字段中填“克, 升”, 这样填写在逻辑上没有错, 在实际生活中有没有人用“升”或“克”去度量“雨水”不得而知,起码在报纸和教科书上没有见到。又如“面子”它有三个意思: ①物体的表面, :被面子; ②体面,:爱面子; ③情面, :给他留一点面子。以上是人们常说的, 但也有人口语中说“你给我一个面子好不好!”这可能是“个”用得太滥的缘故造成的。因为这句话成立, 从而可以推论“面子”受个体量词修饰, 那么“面子”就成了可数的个体名词了。我们认为这样归类就不合适了。原因是这种用法很特殊,除了口语偶而用“一个”以外, 别的数量结构都不能修饰。 严格的说“面子”的三个意思,都不受个体量词修饰。②、③只受不定量词“一点儿”修饰,所以“面子”是属于不可数计量名词。

    一个名词与一个量词能否进行搭配,取决于它们各自的语义特征有无吻合之处,  往往一个名词可以与几个量词搭配,或者一个量词可以与几个名词搭配,  这说明它们各自有若干语义特征,只要其中一点吻合,即存在这种搭配的可能性。对于不常用的词语来说, 能否搭配的可能性首先要搞清楚。对于多数难填的词语来说, 关键是实际上是不是这么用。这一点有时很难判断。我们在这里提这个问题的主要目的是想说明对填的每一个词语都必须弄清词意、用法。现代汉语语法信息词典里所填的信息应该是大家常用的、规范的。

 

 

参考文献

 

[1] 俞士汶, 《信息处理用现代汉语词语分类体系技术报告》, 1993.7 暂未发表

[2] 朱德熙, 《语法讲义》, 商务印书馆, 1984

[3] 房玉清, 《实用汉语语法》, 北京语言学院出版社

[4] 刘学敏, 邓崇谟, 《现代汉语名词量词搭配词典》, 浙江教育出版社, 8912

[5] 陈保存、陈桂成、陈皓、张在瞻, 《汉语量词词典》, 福建人民出版社, 1988

 

 

本文经压缩发表在《中国计算机报》1994年第21期第79

 

 

 

. 动量词

  

    ,,,,,,,

 

. 时量词

   

    ,,,,,分钟,,,会儿

 

. 名量词

 

1  个体量词  ,,,,,,,,,,,,,,,,,,,,,,

             ,,,,,,,,,,,,,,,,,,,,,,

             ,,,,,,片儿,,,,,,,,,,,,,,,

             ,,,,,,,,,,,,,,,,,,

 

2  集体量词  ,,,,,,份儿,,,,,,,,,,系列,

 

3  度量词    ,,,,,,公斤,公里,公顷,毫米,毫升,,,,,立方米,,

             ,,平方公里,平方米,千瓦,,,微米,

 

4  容器量词  ,,,,,,,,,,,,,,,,,,,,

 

5  成形量词  ,,,,,,,,,,,,,,,,,,,,,,

             ,,,,,,,,,,,,,线

 

6  倍率量词  ,,

7  种类量词  ,,,,

8  不定量词  ,点儿,

9  复合量词  架次,人次,人年,辆次,台次,台班,吨公里,秒立方米