艺术中国 中国古籍全录 中国汉语字典 西汶书场 西汶艺术品 登录 注册新用户
新西兰2000G古籍资料

汉字的数量

将本文分享到:
汉字的数量并没有准确数字,大约将近十万个(北京国安咨询设备公司汉字字库收入有出处汉字91251个),日常所使用的汉字只有几千字。据统计,1000个常用字能覆盖约92%的书面资料,2000字可覆盖98%以上,3000字时已到99%,简体与繁体的统计结果相差不大。

历史上出现过的汉字总数有8万多(也有6万多的说法),其中多数为异体字和罕用字。绝大多数异体字和罕用字已自然消亡或被规范掉,除古文之外一般只在人名、地名中偶尔出现。此外,继第一批简化字后,还有一批“二简字”,已被废除,但仍有少数字在社会上流行。

汉字数量的首次统计是汉朝许慎在《说文解字》中进行的,共收录9353字。其后,南朝时顾野王所撰的《玉篇》据记载共收16917字,在此基础上修订的《大广益会玉篇》则据说有22726字。此后收字较多的是宋朝官修的《类篇》,收字31319个;另一部宋朝官修的《集韵》中收字53525个,曾经是收字最多的一部书。

另外有些字典收字也较多,如清朝的《康熙字典》收字47035个;日本的《大汉和字典》收字48902个,另有附录1062个;台湾的《中文大字典》收字49905个;《汉语大字典》收字54678个。20世纪已出版的字数最多的是《中华字海》,收字85000个。

在汉字计算机编码标准中,目前最大的汉字编码是台湾的“国家标准”CNS11643,目前(4.0)共收录可考证之繁简、日、韩语汉字共76,067个,但并不普及,只有在户政系统等少数环境使用。台港民间通用的大五码收录繁体汉字13053个。GB18030是中华人民共和国现时最新的内码字集,GBK收录简体、繁体及日语、韩语汉字20912个,而早期的GB2312收录简体汉字6763个。而Unicode的中日韩统一表意文字基本字集则收录汉字20902个,另有两个扩展区,总数亦高达七万多字。

初期的汉字系统字数不足,很多事物以通假字表示,使文字的表述存在较大歧义。为完善表述的明确性,汉字经历了逐步复杂、字数大量增加的阶段。汉字数量的过度增加又引发了汉字学习的困难,单一汉字能表示的意义有限,于是有许多单一的汉语意义是用汉语词语表示,例如常见的双字词。目前汉语书写的发展多朝向造新词而非造新字。

汉字是语素文字,总数非常庞大。汉字总共有多少字?到目前为止,恐怕没人能够答得上来精确的数字。

关于汉字的数量,根据古代的字书和词书的记载,可以看出其发展情况。

秦代的《仓颉》、《博学》、《爰历》三篇共有3300字,汉代扬雄作《训纂篇》,有5340字,到许慎作《说文解字》就有9353字了,晋宋以后,文字又日渐增繁。据唐代封演《闻见记·文字篇》所记晋吕忱作《字林》,有12824字,后魏杨承庆作《字统》,有13734字,梁顾野王作《玉篇》有16917字。唐代孙强增字本《玉篇》有22561字。到宋代司马光修《类篇》多至31319字,到清代《康熙字典》就有47000多字了。1915年欧阳博存等的《中华大字典》,有48000多字。1959年日本诸桥辙次的《大汉和辞典》,收字49964个。1971年张其昀主编的《中文大辞典》,有49888字。

随着时代的推移,字典中所收的字数越来越多。1990年徐仲舒主编的《汉语大字典》,收字数为54678个。1994年冷玉龙等的《中华字海》,收字数更是惊人,多达85000字。

如果学习和使用汉字真的需要掌握七八万个汉字的音形义的话,那汉字将是世界上没人能够也没人愿意学习和使用的文字了。幸好《中华字海》一类字书里收录的汉字绝大部分是“死字”,也就是历史上存在过而今天的书面语里已经废置不用的字。

有人统计过十三经(《易经》、《尚书》、《左传》、《公羊传》、《论语》、《孟子》等13部典籍),全部字数为589283个字,其中不相同的单字数为6544个字。因此,实际上人们在日常使用的汉字不过六七千而已。

汉字的历史非常悠久,大约已有三千年的历史了。在三千年中,汉字随着社会的发展,有的旧字虽然消失了,但更多的汉字又出现了,因此,汉字总的趋势是增加的。

商:甲骨文约3500个至4500个字。

汉:杨雄《训纂编》收录5340个字。

汉:许慎《说文解字》收录9353个字。

魏:李登《声类》收录11520个字。

魏:张揖《广雅》收录18151个字。

梁:顾野王《玉篇》选定22726个字。

宋:陈彭年等《广韵》收录26194个字。

宋:张麟之《韵海镜源》收录26911个字。

宋:司马光等《类篇》收录31319个字。

明:梅膺祚《字汇》收录33179个字。

明:张自烈《正字通》收录33549个字。

清:张玉书等《康熙字典》收录47035个字。

现在《汉语大字典》选取了约6万字。