世界诸语言之源起与演进 6

楼主

玉脑 [离线]

1★☆☆☆☆

发帖数:126 积分439
1楼

汉语是论人口世界上最大的语言,有十多亿人以汉语为母语:这包括在
□□的二千万、马来西亚的五百万、泰国的五百万、香港的五百万、新加坡的
二百万、印度尼西亚的一百万、越南的一百万等。汉语是联合国1945年成
立时的五种工作语言之一(1974年又加上了阿拉伯语)。

汉语有七种主要的方言:北方方言约占总人口的四分之三,所覆盖的地域包括
中国的东北、华北、西北、山东、河南、湖北和安徽、江苏的长江以北部分、
四川、云南和贵州的汉族人聚居区,在另外还有一些北方方言的“孤岛”在福
建、广西和海南;吴方言,通行于江苏的长江以南部分、浙江和上海市,人口
有七千万,是第二大方言;粤方言,主要流行于广东、广西和海外华人中间,
约有六千万人;闽方言,通行于福建、□□和东南亚诸国,约有六千万人,其
中情形十分复杂,到了互不通行的程度,可能是汉人在秦汉时代南侵时与当地
的语言交互的结果;湘方言通行于湖南;赣方言通行于江西,这两种方言的特
征不太突出,受周围方言的影响较大;还有客家话,主要分布于广东、广西、
福建和□□。这些“方言”之间差别常常是很大——比如北京人听广州人讲话,
决不比英国人听法国人讲话轻松,□□人去听陕西话,也会听得一头雾水。是
什么理由语言学仍把这些方言统统归为一种语言?除了长期以来的统一民族、
统一文化和统一国家这些因素以外,还有一个重要的原因是文字——汉字。

从商朝的甲古文开始,汉字有三千多年的连续历史,三千多年来汉字的字形、
字义的变化都是连续的。与大多数其它语言不同的是,汉字的发展经历了一条
象形—表意—形声的途径。这条道路产生了两个主要效应:第一,随着文明的
不断发展,语言所要表达的概念不断增加,使得汉字拥有了一个数量庞大的字
符集(虽然现代汉语已经不用增加字符来表达新的概念,而是创造新词,这在
一定程度上减少了使用的字数)。汉字的庞大的字符集使它显得非常复杂:难
学、难记、难用;第二,历史上的汉字作为表意文字(ideograph),
文字与语音没有直接关系,无论用哪种语言或方言去读,意义没有变化。这是
几千年来各种口语分化交熔变迁,而汉字一直作为一种统一的文字被所有人认
同的原因。这一优势甚至体现在当它被别的语言借用的时候:哪怕不懂日语的
人也能读懂一半意思吧。汉字使操不同口语的人互相交流成为可能,而隔膜是
统一的主要障碍。

后来,随着汉字的演变,汉字已不再是纯粹的表意文字,许慎『说文解字』中
的9353字里面,“形声字”占了80%以上,“会意字”不到20%,而
甲骨文中形声字仅占20%多。特别是近年来多音词的比例急剧上升,汉字已
向表音文字方向发展。(关于“形声字”、“会意字”,后面还要提到。)

现代汉语的文字仍有几万字之多,但是使用频率极不平衡。据北京语言学院
1985年的统计结果,最常出现的前十个字及其出现频率为:

的   4.16%    (你每说二十五个字就要说一个!)
一   1.84%
了   1.71%
是   1.52%
不   1.37%
我   1.28%
在   1.08%
有   0.98%
人   0.97%
这   0.93%

累计 15.85%

前100字的累计字频已达47.34%,500字到了79.76%,
2000字覆盖了98.07%,如果你认识4000字(就象我一样),你
读一万个字只有四个不认得(当然读我写的东西再多你也不会有不认得的字,
因为我认的字和你一样多)。

语言学院还统计了词:共计出31159个不同的词,其中单音节词(一个字
的)占12.2%,双音节词73.6%,三音节词7.6%,四音节词6.4
%五以上的占0.2%,平均词长2.09。前100词的累计频率为41.7%
,2000词为82.2%,9000词为95.85%。不同汉字的构词能力
(与别的字组成新词的能力)也不一样,最多的是“子”字,构词668个。


2015/10/15 22:38:51
返回本版
1

请您先 登录 再进行发帖

快速回复楼主