当前位置 —论文政治— 范文

关于数据库方面论文范文,与“全文数字化清代档案文献数据库”的建设相关论文查重软件

本论文是一篇关于数据库方面论文查重软件,关于“全文数字化清代档案文献数据库”的建设相关大学毕业论文范文。免费优秀的关于数据库及数字化档案及信息技术方面论文范文资料,适合数据库论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。

自2001年中国第一历史档案馆利用数字技术进行的明清档案文献信息资源建设以来,以目录数据与原文数字图像挂接为形式的数据库建设取得了很大进展,共生成机读目录条目200万条,原文数字图像500余万幅,使得馆藏朱批奏折、录副奏折、部分题本及专题档案等200万件档案实现了自动检索和局域网在线调阅,大大改善了利用条件,支持了国家纂修清史工程.

但是,已有数字化成果在对档案内容的揭示方面深度不够,不能给读者带来更多便利.另外,一些篇幅巨大的簿册式档案文献,如“上谕档”、《实录》、《会典》、“起居注”等,因记事繁复,内容重要,缺少题名,按其内容逐条著录则工作量极大,故此类档案文献不便采用目录数据与原文数字图像相挂接的形式,因此,如果缺少了全文数字化模式,势必不能满足不同档案文献数字化加工与利用的需求,影响馆藏信息资源组织开发的系统性.自2001年项目提出起,一直努力运作,直至2005年年底终于筹措到“全文数字化清代档案文献数据库”建设的首批启动资金,此时海内外一些文献机构在清代档案文献全文数字化产品的制作上已取得了一定先机.我们根据自身所占有的档案文献信息资源的特殊地位,认真审视了其他文献机构开展清代档案文献全文数字化的思路,并仔细分析了其全文数字化产品的得失,在此基础上与北京书同文数字化技术有限公司合作,进一步完善了“全文数字化清代档案文献数据库”建设的构想,并有计划地予以实施,最终将建成最具规模的具有全文检索功能的清代档案文献专业数据库.


怎么写数据库本科论文
播放:25896次 评论:4900人

建设思路

根据当前古籍数字化技术水平和馆藏档案文献文本、形制、字体、内容重要程度,以及读者利用需求等多种因素,首先明确“全文数字化清代档案文献数据库”建设的基本思路.

选项范围.入选“全文数字化清代档案文献数据库”建设计划的档案文献,一般应为正楷(印刷体、手写体均可),以易于OCR自动识别技术的应用,减少差错,提高效率,同时,其内容价值决定其在馆藏档案信息资源中占有核心地位,以提高全文数字化经费投入的效益.

计划性.具体项目实施须强调计划性力避盲目,充分照顾阶段性成果间的匹配以提高成果的系统性.例如全文数字化阶段性项目间的匹配:《实录》与《圣训》、“起居注”;全文数字化项目与目录挂接原文图像项目间的匹配:“上谕档”、“随手登记档”与“朱批奏折”、“录副奏折”.如此保证阶段性成果间的内在联系.

成果基本要求.全文数字化各项成果的基本要求是保真、功能完备版本多样.

保真.将原文图像与数字化文本挂接作为基本模式,在保证成果信息完整、正确的基础上,限制数字化文本的差错率在万分之三以内,同时尽可能地争取数字化文本版式、字体、标点接近原文样式,另外为读者提供阅读中的勘误功能使文字识别的差错趋向于零.

功能完备.各项成果须为方便读者阅读提供人性化功能,包括浏览、检索、下载、勘误、笔记、书签以及中西历转换和字典等功能,尽可能地满足读者多样性的阅读习惯和需求.

版本多样.成果宜具备多种版本样式,如单机版、局域网版和互联网版,以满足各类读者群的需要.

实施情况

依据上述基本思路,我们于2005年年底,首选馆藏《实录》、《会典》开启了“全文数字化清代档案文献数据库”的建设工程.

1.版本调研

通过认真的版本调研,把握可提供进行全文数字化的数种《实录》、《会典》的版本情况.

首先,结合当前相关版本研究的成熟学术观点,确定数字化应用版本.《实录》以馆藏大红绫、小黄绫本为主要版本,并补充少量小红绫本和个别其他文献机构保藏的特殊版本;《会典》以馆藏四朝《会典》为主要版本,其中《康熙朝大清会典》、《雍正朝大清会典》、《嘉庆朝钦定大清会典》及其《会典事例》、《会典图》,经故宫博物院专家协助鉴定为殿本,《光绪朝钦定大清会典》及其《会典事例》、《会典图》,为石印本,《乾隆朝钦定大清会典》及其《会典则例》另选用《四库全书》本.

其次,对选定版本进行详细翻查,对破损页进行登记,用其他文献机构保藏的相同版本进行弥补.对不同版本中可能影响自动识别的一些特殊格式和标记、标点等(如格、批注、贴条、异位标点等)加以记录并研究确定处理方法.

认真的文献调研,不仅为选择版本和预设数字化加工流程、数字化技术参数以及质检步骤提供了切实的依据,而且明确了强化软件功能的具体需求,从而保障了工程各环节的衔接顺畅,为优化成果奠定了基础.

2.编辑

与版本调研同步,紧紧围绕严谨和方便读者阅读、研究的要求,对目前同类数字化产品的情况进行了研究,本着弘优汰劣的原则完善编辑方案.

如《实录》,以太祖高皇帝至德宗景皇帝十一朝《实录》为主体.同时,考虑到《宣统政纪》与《实录》体例无异,并考虑到《太祖武皇帝实录》(顺治写本)与《太祖高皇帝实录》(雍乾校勘本)的差异,另外,还考虑到《满洲实录》与《实录》体例和纂修程序的不同,且汉文部分又与《太祖武皇帝实录》差异较大,故将此三者附录于后,定名为《大清历朝实录》,以尽可能地维护历朝《实录》的完整,并使读者对不同文本间的差异有所了解,除此以外,针对市场现有同类数字化产品不便浏览的缺陷,编有两套目录浏览模式,一套为原本卷次目录,一套为朝年月时序目录,以方便读者浏览.

又如《会典》,考虑到大清十二帝十三朝中共编有五部《会典》,分别修于康熙、雍正、乾隆、嘉庆、光绪朝,俱为满、汉文单行本,由于编纂年代不一,典章制度的增损因革以及则例、事例的删繁就简等情况趋于复杂化,而目前著书立说者大凡以光绪朝所修《会典》为本,于研究而言不够严谨.同时在刊布方面,中国大陆和台湾出版的大清《会典》,俱为光绪朝版本,而新近由线装书局出版的《大清五朝会典》,仅收康熙、雍正朝《大清会典》和乾隆、嘉庆、光绪朝《钦定大清会典》及嘉庆、光绪朝《钦定大清会典图》,而缺乾隆朝《钦定大清会典则例》和嘉庆、光绪朝的《钦定大清会典事例》,略去近三分之二的内容.为方便各类学者全面认识清代典章制度的发展变化,支持其清史、法制史研究,我们此次全文数字化囊括了汉文大清五部《会典》的全部内容,定名为《大清五部会典》.同样保持了浏览模式并编有原本卷次目录.

3.强化保真

保真是数字化档案文献具有权威凭证价值的关键性保障,因此也是我们开展“全文数字化清代档案文献数据库”建设的基本思路之一.在《大清历朝实录》和《大清五部会典》全文数字化工程的实践中,我们对此有了更清晰的认识:首先,原文图像页的价值在于能够如实地保留版本信息和原始的修改、贴补信息,这是数字化文本页所不能准确模拟的.尽管因时间久远造成部分页面字迹不够清晰,使得图像不甚漂亮,但上述信息对于治学严谨的版本学和历史研究学者来说都是有价值的和不容忽视的.另外,数字化文本无论做得多么精细,也很难完全避免人为的差错(最起码读者心理上的芥蒂是固有的),因此,向读者提供版式漂亮且具有全文检索和完善的辅助阅读功能的数字化文本,使读者快速、全面地&

1 2

关于数据库方面论文范文,与“全文数字化清代档案文献数据库”的建设相关论文查重软件参考文献资料:

怎么写政治论文

政治工作论文

形势政治课论文

政治小论文

政治论文题材

国际政治论文

本科政治论文

政治学论文发表

思想政治专业论文

民主政治论文

“全文数字化清代档案文献数据库”的建设WORD版本 下载地址