国标7万字部首序的编排设计
摘 要 文章阐述了国家标准《信息技术中文编码字符集》(7万余字)部首序的研制方案,重点说明了部首数量、提取部首和归部的原则及方法,并分析了201部首方案和多开门归部方法的得失,对部首查字法的研究与规范有一定参考价值。
关键词 部首 归部 201部 7万字部首序 多开门
一、部首数量
新增附列部首举例如下:(前边为主部首,后边括号里为新增附列部首)
^() 牛() (网) 齿(n)
附列部首包括繁体字部首(如“马”部的“R”,“龙”部的“”)和变形部首(如“手”部的“扌”,“心”部的“忄”),均不作为与主部首相对独立的部首。
二、提取部首及归部的原则
(一)继承传统
分析字形结构、提取部首及归部时尽可能考虑汉字造字的理据性,保留汉字文化的信息。如:“雌”由此和隹构成,归隹部,不归止部;“含”由今和口构成,归口部,不归人部;“愿”由原和心构成,归心部,不归厂部;“募、幕、墓、蓦、暮、慕、摹、”分别由莫和力、巾、土、马、日、心、手、言构成,归下边的部首,不归上边的艹部。
(二)据字形结构特点定部
提取部首及归部时主要根据字形的结构特点,一般不考虑造字本义。如:“颖”本为从禾顷声的形声字,今归页部,不归禾部;“修”本为从彡攸声的形声字,今归亻(人)部,不归彡部;“Y”和“觳”本为从禾或角声的形声字,今归殳部,不归禾部或角部。
(三)逐级切分
合体字提取部首时,采用逐级切分法。
1.尽可能成字进行切分,不破坏汉字结构的理据性。
2.首先一分为二进行切分。如:“煎”切分为前和灬(火),其中火是部首,归火部,不归八部;“靠”切分为告和非,其中非是部首,归非部,不归(牛)部;“鹏”切分为朋和鸟,其中鸟是部首,归鸟部,不归月部。
3.如果一分为二切分后没有部首,再一分为
三、一分为四地逐级逐层次进行切分。如:“耀”先左右切分为光和翟,没有部首,再把翟上下切分,上边的羽和下边的隹都是部首,优先取上,归羽部;“舞”先上下切分,没有部首,再把下边的舛进行左右切分,其中夕是部首,归夕部;“疑”先左右切分,没有部首,再把左边进行上下切分,上下都是部首,优先取上,归匕部。
4.对合体字进行切分时,优先从相离部分切分,其次再切分相连的结构。如:“善”为上下结构,切分为两部分,下边是口,归口部,不归羊部。“章”切分为立和早,归立部,不归音部。(群众在生活中也常说:“我姓章,是立早章,不是弓长张。”)“竟”也归立部,不归音部。
5.对合体字进行切分时,有些常见的特殊组合单元,应视为一个整体,不能随意分割。如:“堂、常、棠、掌”切分为尚和土、巾、木、手,分别归土、巾、木、手部;“荣、s、萤、”切分为、和木、虫,分别归木或虫部;“选v、”切分为和日、止、石,分别归日、止、石部。
6.对于疑难字,在研究查证的基础上予以科学切分。如:“彬”可以切分为林和彡,也可以切分为木和杉。分析造字来源,是形声字,从彡,焚省声,彡象须毛形,指文饰,本义为有文采。彬彬,形容文雅。可见应归彡部,不归木部。“Y”可以切分为耳和邓,也可以切分为取和阝(邑)。分析造字来源,是形声字,从邑,取声,本义为古代地名,在今山东曲阜东南,是✈孔子的家乡。也写作“陬”,从阝(阜),取声。可见应归邑部,不归耳部。“邸笨梢郧蟹治上下结构,即晶和生,也可以切分为上中下结构,即日、R、生。分析造字来源,是形声字,从晶,生声,晶由三个日组成,像天上的繁星,故本义为“星”的古文。《说文解字》归晶部,《汉语大字典》归日部。201部首表没有晶部,因而归日部,我们认为不如归生部,这样不至于破坏原字结构的理据。
三、归部的方法
(一)独体字归部方法
1.如果是部首,则归入该部。如:“山”归山部,“虫”归虫部,“鱼”归鱼部。
2.如果不是部首,则按起笔笔形归部。如:“井”归一(横)部,“且”归丨(竖)部,“年”归丿(撇)部,“之”归丶(点)部,“民”归^(折)部。
(二)合体字归部方法
1.如果只有一个部首,则归入该部。如:“鸭”归鸟部,“新”归斤部,“吴”归口部,“区”归匚部,“疗”归疒部,“远”归辶部,“题”归页部。
2.如果有两个或两个ษ以上的部首,或当对字形切分到某一级时出现两个或两个以上的部首,则处理方法为:
(1)左右、左中右结构的,取左不取右。如:“鸡”归又部,不归鸟部;“则”归贝部,不归刂部;“狱”归犭部(犬部的附列部首,部首外笔画为6画,而非5画)。
(2)上下、上中下结构的,取上不取下。如:“昏”归氏部,不归日部;“思”归田部,不归心部;“牵”归大部,不归牛部。
(3)包€围或半包围结构的,取外不取内。如:“国”归囗部,不归玉部;“句”归勹部,不归口部;“问”归门部,不ญ归口部;“氧”归气部,不归羊部;“连”归辶部,不归车部。
(4)如果部首在四角,一般根据字形结构,按左上、左下、右上、右下的顺序取部首。如:“疑”归左上角的匕部,“毓”归左下角的母部,“耀”归右上角的羽部,“赜”归右下角的贝部。
(5)分析不出部首的字,按起笔笔形归部。如:“奉”归一(横)部,“畅”归丨(竖)部,“卵”归丿(撇)部,“举”归丶(点)部,“甬”归^(折)部。
(6)单笔部首和多笔部首都有的,取多笔部首,不取单笔部首。如:“灭”归火部,不归一部;“旧”归日部,不归丨部;“系”归糸部,不归丿部;“主”归王部,不归丶部。
在具体字的部首确定方面,本课题没有完全采用《GB13000.1字符集汉字部首归部规范》的处理方法,而是尽可能考虑汉字造字的理据性,根据字形的结构特点,科学归部。
四、部首和部属字的次序
(一)部首的排列次序
按笔画数多少和笔顺次序排列。
(二)部首统属字的排列次序
1.先排主部首统属的字,后排附列部首统属的字。如:攴部先排从攴的字,后排从攵的字;水部先排从水的字,后排从氵的字。
2.正部首、繁体字部首和附列部首所统属的字,一律按部首之外的笔画数和笔顺排列次序。如:“马”和“R”、“龙”和“”、“手”和“扌”、“心”和“忄”等部首的笔画数不同,忽略不计,只按部首之外的笔画数和笔顺来排序。
3.部首相同的字按部首之外的笔画数和笔顺来排序。
4.当笔画数和笔顺都相同时,排序细则为:
(1)按字形结构,先排左右结构,次排上下结构,再次排半包围结构。如:日部“U”在“易”前,鸟部“Z”在“[”前,毛部“帧痹凇亍鼻啊
(2)当字形结构相同时,先排主部首的字,后排附列部首的字。如:犬部“猷”在“q”前(均为左右结构),马部“蓦”在“”前(均为上下结构),部“”在“”前(均为半包围结构)。
五、部首查字法规范待解决的问题
(一)据义归部和据形归部的局限
《说文解字》和《康熙字典》确定部首的原则基本依据字的本义,如:“松”本义为树名,归木部;“问”本义为以口询问,归口部而不归门部;“牢”本义为牛圈,归牛部而不归宀部;“胖”本义为古代用于祭祀的半只的牛、羊、猪等,归半部而不归月(肉)部。据义归部的局限主要在于,当不清楚本义时往往无法准确判断部首。
(二)“多开门”归部方法的得失
如何处理归部分歧的字?这是部首查字法历来难以解决的问题。《新华字典》《现代汉语词典》和《新华多功能字典》的部首检字表对归部有分歧的字采用多开门的办法,分别归入几个不同的部。如:“九”归丿部,又归乙部;“丰”归一部,又归丨部;“古”归十部,又归口部;“则”归刂部,又归贝部;“军”归冖部,又归车部;“元”归一部,又归二部和儿部;“处”归丿部,又归夂部和卜部;“耀”归小部,又归羽部和隹部;“疑”归丿部,又归匕部、矢部和疋部等。
过去一般认为,多开门的办法仅适用于排检字表,如果用来排正文,就会因多处重见而造成条目芜杂和篇幅浪费。现代信息技术的发展日新月异,计算机存储和运行能力极大提高,数据库的容量限制已不再成为难以逾越的障碍,只要不是采用纸☒质载体,那些归部有分歧的字不妨多开门,同时收在几个部,这种灵活变通的办法将给使用者带来很大的便利。前文所述的“愿、愈、盒、凳、鹏、雌”等字如果不囿于某个部,在其他部中也能查到,岂不善莫大焉?