一种关于家谱数字化的方法技术

技术编号：2839132 阅读：278 留言：0更新日期：2012-04-11 18:40

一种关于家谱数字化的方法，其特点在于：将家谱中的“人”作为树状或森林状结构的一个数据节点，并使用支持Ｕｎｉｃｏｄｅ（统一码）四字节编码汉字超大字符集及其输入法进行数据加工。该方法能够处理家谱书籍中所出现的绝大多数的生僻字，同时按照家谱的树状或森林逻辑结构，把家谱中大量的节点数据存储到具有这种逻辑结构的ＸＭＬ格式文件中，再把这些节点数据采用倒排索引的方式建立索引并提供检索，并对家谱中每个人的世系关系以直观，友好的“目录树结构”方式呈现在网页页面或桌面应用程序的界面上。这种方法可以避免家谱数字化加工与整理过程中的生僻字无法管理，及结构混乱无法大规模加工和存在重复录入数据的问题，加速了家谱数字化加工进程，使得对大量家谱进行数字化处理与检索、管理成为可能，有利于家谱的保护与开发利用。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于计算机领域，具体涉及一种对家谱进行数字化处理的方法。
技术介绍
中国家谱历史悠久，总量可观，是中华民族一笔巨大的历史文化遗产。家谱又称宗谱、族谱或谱牒，是以记载一个血缘家族的世系与事迹为主要内容的史类文献。我国历史上家谱的出现至少可追溯到先秦时代，明清时期私修家谱更是成为一项全民性的文化活动。家谱有一定的编写体例，主要记述家族的历史沿革、世系繁衍、人口变迁、居地迁徙、婚姻状况，家族成员在科贡、官封名谥等政治生活中的地位、作用和事迹(包括著述)，家族的经济情况和兴衰变化，以及家族的丧葬、祀典、族规家法等，因此，家谱是一种能够比较真实反映历史面貌、时代精神、社会风尚的载籍，历代学者都把谱系之学看作是一门重要的学问，是史学(正史、方志、家谱)的组成部分。近年来，越来越多的人希望通过对家谱的研究，来追溯家族发展的历史。家谱里所记载的丰富宝贵的资料，不但可以帮助人们了解自己的祖先和族人，而且也是历史学、社会学、民族学、文化人类学、人口学、优生学等学科的宝贵资料，有着巨大的学术研究价值。因此，对各种各样的家谱进行数字化处理具有重要的意义，这既可以加快家谱的保护与开发利用，又可以节省许多家谱研究者的精力和时间。然而，在对家谱进行数字化处理的过程中经常会遇到如下几个特殊性的问题1.绝大多家谱是由古代写到现代，多用中文繁体字，后续的也有简、繁体字共存的。其中涉及到的很多人名、地名，不但用到很多生僻字，而且还有大量的异体字、异构字，用字量大。但是现今常用的计算机系统所能处理的汉字最多只有两万多个字，远远无法涵盖家谱的全部用字。2.家谱中的世系图或表的格式特殊...

【技术保护点】
一种关于家谱数字化的方法，其特征是：能够把各种类型的家谱转换成含有四字节超大字符集汉字的统一格式的电子文档，并利用计算机对这些文档进行管理。

【技术特征摘要】

【专利技术属性】
技术研发人员：邓智伟，李延华，王宏源，
申请(专利权)人：王宏源，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人