我们讲了很多生僻字,有些是特殊字,有些是某个汉字的特殊写法。虽然我们常说常用汉字只有3000个,但有些汉字可能有多种写法。
那么一共有多少个汉字呢?今天就来讨论一下这个问题。
一个
自古以来的汉字数量
汉字五千年的历史太长了,汉字到底有多少不好说。
据学者考证,甲骨文和金文中的汉字约有5000个,我们知道的词义约有3000个。
中国最早的字典《说文解字》收录了9353个汉字。
北宋《雷编》有多达33190个汉字,清代《康熙字典》有46933个汉字,是古代汉字数量最多的字典。
《汉语大词典》收录56000余字,20年出版的最新版《新华字典》收录13000余字。
不要对这个数字感到惊讶。《现代汉语常用字表》只有3500个汉字。《中国语言生活》报告显示,2394个常用汉字占据了99%的语言空间。
所谓常用汉字,以庞中华的硬笔书法为例。小时候家里有这本书,我 *** 着我练。我感到很不情愿。这本字帖2500字。
2
不同编码标准导致的问题
在电脑普及和数字化到来之前,我们只能根据字典来统计汉字的数量。
但数字时代到来后,除了字典,我国 *** 开始定期收集汉字,整理在国家标准文件中。
mainland China最早的标准是在1980年制定的,称为GB2312,即国家汉字信息交换码,在mainland China广泛使用。新加坡等地也使用这个代码。
1983年,台湾省开始使用著名的“大五码”,即big5字体。
这两个标准深深地“伤害”了老一辈电脑游戏玩家的心。在很多三国游戏迷心中,曹操还有另外一个名字-“别格”。
其实这是大五里的“曹操”二字。因为标准不统一,台湾省生产的游戏都在大陆电脑上运行,所以才有了这个奇怪的名字。
为了解决这个问题,当时曾经有一个辅助软件,提供了字符编码选择的功能,可以正确显示部分汉字。
为解决这些问题,1993年5月,中日韩联合研究组正式制定了CJK(中日韩统一表意文字)。同年,国际标准化组织发布了10646,我国也基于该标准制定了GB13000.1-93。
三
大概的汉字个数
为什么汉字的标准不是中国制定的,而是国际制定后才是国家标准?这是因为虽然汉字是中国本土的,但是使用汉字的国家并不局限于中国。
最典型的是日本、韩国、越南。他们的文字,无论是叫“汉字”,还是在书写、发音、意义等方向,都明显具有汉字的特征。
“米”字当选日本2020年度汉字。
所以iso字体的来源也包括这些国家;此外,海外中文古籍数量庞大,各国或有汉字文化研究机构,或与国内汉字研究机构合作,定期向iso报告新汉字。
需要说明的是,按照国际汉字标准制定国内汉字字符集的做法一直沿用至今。
所谓“汉字总数”有一个通用的参考标准:
此外,2012年,我国启动了“汉字库”项目,旨在对30万个汉字、10万个少数民族文字和10万多个甲骨文等生僻古文字进行编码,共计约50万字。
四
汉字数量的发展
50万汉字的数量已经覆盖了历史上所有的汉字。但是,这个数字不会增加。
我们常说语言是“约定俗成”的东西,汉字在这方面也差不多。例如,在2020年发布的iso10646扩展字符集G中,已经包含了民间字符biáng。
此外,在化学工程领域,也有一些新创造的汉字。2017年5月9日,新化学元素中文名称公布,两个新造词列入国家标准词,分别是——
这些汉字将会是我们现在和未来 *** 通讯和数字通讯的基石。
五
汉字输入的难题
然而,随着汉字的增多,我们不得不面对一个新的问题:如何输入这么多汉字?
比如我们经常用拼音输入法。汉语拼音有300多个读音,gb2312时代有6000多个字。如果输入一个读音,对应的汉字数量平均只有二三十个。
按照输入法,每行显示十个候选字,翻两三次页就能找到想要输入的汉字。
但是,如今汉字的数量已经达到了9万个,平均每个读音下有300页的候选汉字。
我们需要翻300页才能找到我们想要输入的某个汉字吗?
我们都遇到过这样的问题。我们在拼音输入法下搜索过某个单词,还没找到。只要我们更仔细地回头看,输入一个单词可能需要几分钟。
别急,有好办法。之后,我们有机会和你慢慢聊这个问题。
结束
闪闪发光的词语
汉字博大精深,
常用汉字不足3000个;
《新华字典》约有8000个汉字;
现在的电脑、手机等终端,
可显示约3万个汉字;
国家标准GB18030-2005于2005年、
收录汉字7万多个;
以及最新的国际标准10646,
收录了90000多个汉字。
更多的汉字,
如果你不知道也不能在电脑上打出来,
这些汉字文化都失传了。
我们要做的就是和你一起工作,
寻找汉字文化。
欢迎:我的单词是Jane 。