冷玉龙点头:“类似的干扰我们也遇到过。”
韦一心说道:“岛国也跟我们提出过合作愿望,想要和我们一起合编一部《中日汉字海》,字数想要超过我们现在编纂的《中华字海》。”
“那我们同意了吗?”周至赶紧问道:“这个情况我们倒是真不知道。”
“我们的意见还是自己单独做。”韦一心说道:“反正我们已经做到了八万七千多字,也不差这一哆嗦。”
“现在看来,他们对我们的瀚文字库如此热心,还真不见得就是声东击西,贪图我们的专利软件包。”辜开来看向了周至:“搞不好是想要搂草打兔子!”
周至将两件事情关联起来一想,还真是大有可能。
“如果能够独立完成的话,我也觉得还是独立完成比较好。”周至说道:“而且我现在发现,辞书的编纂工作和字库的编写工作相结合,既能够让字库工作节省大量的前期准备,又能够将辞书首先实现数字化,成为字库建好后的第一个最合理的数字化成果,可谓是相得益彰的双生项目。”
“技术上,蜀大计算机中心几乎已经解决了全部的问题,现在的瓶颈,主要就是大量的原始工作——字码建卡部分。”
“刚好,这部分工作无论方法还是成果,都和我们的辞书编纂工作有相当大的同质性。”
“如果我们的方法类似,那么便能够利用为辞书编纂准备的字卡,通过扫描识别程序转入瀚文字库当中,我们的工作进度就会得到极大的加快。”
“而这个时间段里,两位师兄则可以继续下一步的工作,将日韩汉字编纂进来。”
“等到你们编纂完毕,我们的工作也差不多完成了,再将后续工作做完,立刻就可以进入数字化排版出版工作。”
“这既是两位师兄多年来心血的结晶,又可以立即实现成果转化,数字化转码,数字化排版,数字化出版,《中华字海》将会是我国第一部数字化排版的辞书,同时也是最大的一部辞书,其意义将是划时代的。”
辜开来,冷玉龙,韦一心三人面面相觑,现在的年轻人脑子转得这么快的吗?!
《中华字海》的编纂工作是非常艰难的,但是那也只是水磨工夫而已,按部就班八年过来,最大的工作已经磨完了。
更难的却是转化,就是将这部著作出版。
因为里边生字太多,要是用传统的铅字印刷,光铅字码的制作就得大小两套,八万七千多汉字就得十七万个字码,比现在传统的八千铅字码多出十六万枚。
无论将这工作扔给哪家出版社,出版社都得哭。
可要是和瀚文字库的二三期工作同步进行呢?
辞书做出来的那一天,字码也同步完成了,立刻就可以进入排版印刷出版发行阶段!
而且后续的工作也会比传统得到大大的简化和便利。
这就是数字化的威力!
冷玉龙坐不住了,站起身来:“走,我们去一趟部里,找组长汇报这个新形势新情况。”
“别别别……”周至赶紧拉住冷玉龙:“还是先请两位师兄帮我们介绍一下《中华字海》的编纂思路和体例,还有就是我们要先取师兄们的卡表来试试,看是不是真的适合我们现有的扫描识别程序才行。”
“也是。”冷玉龙不禁赧然:“有点失态了,主要是听到小师弟这个玩法,有点激动啊。”
“你老师兄性格就是这样。”辜开来笑着和周至介绍:“当年师伯才给他取字冷泉,加上他的姓,就叫冷冷泉,希望他能比别人多一层冷静。”
“原来是这样。”周至觉得前辈们的故事有点好玩。
“结果脾气还是老脾气。”辜开来就笑话师弟。
“还是说正事儿吧。”韦一心笑道:“刚刚小师弟说的,中日韩大区的概念,我们在《中华字海》里边,其实也在采用。”
“是吗?”周至感到很惊喜:“我就觉得小九万字的辞书,不可能这么简单!”
冷玉泉笑道:“《中华字海》主要由两部分构成:一部分收自现存汉语辞书,如《说文解字》、《玉篇》、《广韵》、《集韵》、《康熙字典》、《汉语大字典》等书中的全部汉字;”
“另一部分,则是历代工具书失收,而应该收录的字。”
“其中有佛经难字、道藏难字、敦煌俗字、宋元明清俗字、方言字、科技新造字,以及当今还在人名和地名用字。”韦一心补充道:“此外,流行台岛、港岛、蒲岛地区的俗字,方言字以及在岛国、高丽、新岛等国通行的汉字,书中也予以收录。”
周至越听越是激动,这玩意儿要是能用的话,瀚文字库都可以直接三期完工了呀!
“那编纂的体例呢?”这回轮到他有些坐不住了。
编纂的体例很重要,如果编制方法和瀚文字库采用的方法区别太大,逻辑上无法实现转码的话,那就只有字卡可以用。
可要是两者是互通的话,字卡的编排逻辑和字库码位的编排逻辑接近,在转码入库这个环节,就可以减少很大的工作量。
“编写体例嘛,《中华字海》收字还是按传统的部首分部排列,同部首字按笔画多少排列,同笔画字按笔顺排列;”
“部首的设立,以《康熙字典》二百一十四部为基础,并酌情删并分离,最终共二百一十部。你们的瀚文字库呢?”
“我们的也是按照《康熙字典》二百一十四部为基础,不过还吸收了王码的字根编制方法,最终一共是二百七十六个字根,其中二百五十九个是王码已经存在的,剩下十七个,是我们在其他非基础汉字里找到的。”
“漂亮!”韦一心表示赞赏:“部首和字根,也符合汉字的构字法,比如福气的福字,甲骨文里就是三个部分构成,首先是最后演化为示字旁的部分,那是祭坛的意思,然后是右边部分,那是一件鬲,禾之类的礼器。底下还有两只手,整个字就是两手拿着礼器摆上祭坛的会意,希望得到祖先赐福的意思。”
“对,回归到汉字的本源,笔画就好像原子,字根就好像分子,最后组织起来的汉语大体系,就是机体了。”冷玉龙说道:“这是非常科学的归纳法,比传统的偏旁加笔画要更先进。”
“但是这个方法不够简明。”周至说道:“因此作为日常所用的辞书,还是按照偏旁笔画更加方便。”