当前位置 —论文写论文— 范文

学术不端类有关论文范文数据库,与期刊发表文字数云南相关毕业论文致谢

本论文是一篇学术不端类有关毕业论文致谢,关于期刊发表文字数云南相关专科毕业论文范文。免费优秀的关于学术不端及已发表及数据库方面论文范文资料,适合学术不端论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。

学位论文学术不端行为检测系统

第一章系统简介

1.1系统概述

学位论文学术不端行为检测系统(简称"TMLC")以《中国学术文献网络出版总库》为全文比对数据库,实现了对抄袭与剽窃,伪造,篡改等学术不端行为的快速检测,可供用户检测学位论文,并支持用户自建比对库.其系统示意图如图1所示.


本文转载于:http://www.sxsky.net/xie/070361597.html

图1检测系统示意图

1.2系统技术路线介绍

TMLC采用CNKI自主研发的自适应多阶指纹(AMLFP)特征检测技术,具有检测速度快,准确率,召回率较高,抗干扰性强等特征. 支持篇章,段落,句子各层级检测, 支持文献改写,多篇文献组合等各种文献变形检测, 支持研究生学位论文,图书专着等超长文献的学术不端检测. CNKI自适应多阶指纹技术原理如图2所示:

2CNKI自适应多阶指纹技术原理图

对任意一篇需要检测的文献,系统首先对其进行分层处理,按照篇章,段落,句子等层级分别创建指纹,而比对资源库中的比对文献,也采取同样技术创建指纹索引.这样的分层多阶指纹结构,不仅可以满足我们对超长文献的快速检测,而且,因为我们的最小指纹粒度为句子,因此,也满足了系统对检准率和检全率的高要求.原则上,只要检测文献与比对文献存在一个相同的句子,就能被检测系统发现.

1.3

系统主要功能包括:已发表文献检测,论文检测,问题库查询,自建比对库管理等.

已发表文献检测:指检测系统能够自动将属于用户的已正式发表的学位论文检索出来,并对每一篇已发表文献进行实时检测,快速给出检测结果.


学术不端学术论文撰写
播放:30142次 评论:5864人

论文检测:主要实现论文实时在线检测功能.

问题库查询:指用户可以将检测结果中确认有问题的文献放入到问题库,便于用户集中管理.

◆自建比对库:指管理人员可以选择将检测文献放入个人比对库或者批量上传文献作为个人比对库,该个人比对库即可作为以后学术不端文献检测的比对数据库,该自建个人比对库完全属于用户,其他用户无权使用.

1.4

TMLC的目的是辅助各研究生培养单位对学位论文质量进行评估,为审查论文提供技术服务.检测系统在对论文进行检测之后,生成检测报告,为判断论文性质提供相关依据.

第二章检测原理及方法

2.1支撑技术

CNKI拥有强大的技术研发队伍,目前已经拥有了具有国际或国内领先水准的全面的数字出版的相关技术,包括资源采集技术,文本数据库加工技术,文本数据库技术,数字资源版权保护技术,知识挖掘技术,自然语言处理技术,快速比对技术等.在海量的全文数据的基础上实现快速准确的检测,上述技术是基本的保证.

期刊发表文字数云南参考属性评定
有关论文范文主题研究: 关于学术不端的论文范文 大学生适用: 研究生毕业论文、学士学位论文
相关参考文献下载数量: 42 写作解决问题: 写作资料
毕业论文开题报告: 标准论文格式、论文题目 职称论文适用: 期刊目录、高级职称
所属大学生专业类别: 写作资料 论文题目推荐度: 优质选题

2.2支撑资源

TMLC需要一个尽可能完备的全文数据比对资源库,而CNKI的《中国学术文献网络出版总库》则正好满足这一要求.到目前为止,CNKI拥有学术期刊7000余种,期刊全文文献2480万篇,期刊期数和文献收录完整率都大于99.9%,文献量居国际国内同类产品之首,出版503家硕士学位点的72万篇优秀硕士学位论文,368家博士学位点的9.6万篇博士学位论文,1286家重要会议论文106万篇,515家重要报纸500多万篇,1376种重要年鉴787万篇,600多种工具书220多万条,学术引文索引数据600多万条,这些出版物做到平均日更新20000条记录,国家标准,专利,SPRINGER数据库也集成到CNKI网络出版平台中,另外,出版平台还集成整合出版了各类第三方数据库资源1020种.

在收录资源种类上,CNKI在国内具有明显优势,收录了期刊,学位论文,会议论文,报纸,年鉴,工具书,专利,外文文献,学术文献引文等与科学研究,学习相关的主要资源.在资源收录数量上,CNKI明显优于同类产品,各个资源库收录年限长,期刊等主要资源库回溯到创刊.在资源更新速度上,CNKI产品除了第三方合作的外文文献以外,其他资源都做到了日更新,单日更新数量大,这是推行产业化,标准化运作的结果.

2.3系统架构模式

2.3.1系统架构图

图3系统架构图

2.3.2系统示意图

检测系统提供整套的文献学术不端行为检测,系统服务器位于CNKI中心网站,用户将待检测的学位论文通过网络在线提交到中心网站服务器,服务器在检测完成后,自动将检测结果返回给用户.整套系统架构为B/S结构,客户端不需要安装任何软件.其系统示意如图4所示:

图4系统示意图

2.3.3系统流程图

图5系统核心流程图

2.4用户提供的资源

实现学位论文的学术不端检测,用户需要提供的资源包括:

1

论文全文内容是检测论文是否存在学术不端行为的基础数据.本检测系统是对提交的论文全文内容进行分析,在内容分析的基础上,生成各项检测指标.因此,全文数据是系统所需要的必要资源.

2

元数据指论文相应的作者,作者单位,发表时间,支持基金项目等信息.元数据是检测系统对学术不端类型进行判断所需的基础数据,为了更准确的便于系统做出预判,用户可以在提交检测文献的同时,一并提交文献的元数据信息.

特别提到的是:在进行学位论文检测的时候,作者信息是非常必要的.输入作者信息,在后续的检测过程中,系统能够自动根据作者信息区分比对资源中的文献是属于该作者已发表的文献,还是他人的文献,为用户快速甄别论文是否存在学术不端行为提供更直观的印象.因为在学位论文中,引用自己以前发表过的文献是合理的.

注意:元数据不是系统必需的数据,用户在使用检测系统的时候,可以选择不填写元数据.但我们建议最好输入作者信息.

2.5

在对用户提交的检测文献检测之后,系统生成的检测结果包括:

1.

系统详细列出重合文字来源文献信息,这些文献都是真实存在,而且应是公开发表或得到发表确认的.

2.

检测文献和来源文献的详细比对信息,用户可以快速选择重合文字部分查阅.

3.

该指标体系从多个角度对检测文献中的文字复制情况进行了概括性描述.

4.

因为学位论文一般较长,因此,系统一般按章检索,并且每一章给出子检测指标,该检测指标从多个角度对该章内容的检测情况进行了详细描述.

5.

系统根据指标参数以及其他元数据相关信息,自动给出一个预判的诊断类型,供审查人员参考.

6.

检测系统自动生成一个检测报告单,详细列出检测文献的学术不端行为检测情况,用户可以对该报告单进行修改,生成终审报告.

注意:系统只对疑似存在学术不端行为的论文生成检测报告.

学位论文学术不端行为检测系统采用的指标体系分为两个部分:

3.1

学位论文一般文献篇幅较大,字数多,硕士论文一般为3~5万字,博士论文则多达十多万字.因此,为了让用户对整个学位论文有一个快速的概况了解,特制定了以下指标体系:

总重合字数(CCA)

总文字复制比(TTR)

总文字数(TCA)

疑似章节数(QCA)

总章节数(TCA)

首部重合文字数(HCCA)

尾部重合文字数(ECCA)

上述指标从整体情况描述了论文的检测情况,便于用户快速了解该论文总的检测概况.下面对上述指标分别进行说明.

3.1.1CCA)

学位论文一般篇幅大,少则3~5万字,多则十多万字,若以文字复制比来衡量一篇论文的文字重合情况,则不太合适.因为对于一篇十几万字的博士论文来说,10%就已达到1万字,文字复制情况已经非常严重.因此,对于博硕士论文检测,检测系统使用绝对字数即总重合字数作为检测结果的核心指标.如图6所示:

图6总重合字数示例

3.1.2总文字复制比(TTR)

总文字复制比则是指学位论文中总的重合字数在总的论文字数中所占的比例.通过该指标,我们可以直观了解到重合字数在该检测学位论文中所占的比例情况.

3.1.3TCA)

总文字数是指该检测论文所有包含的字数,文字复制比与总文字数的乘积即为重合字数.

3.1.4QCA),总章节数(TCA)

疑似章节数是则检测论文疑似存在学术不端行为的章节的数量.总章节数则是指学位论文总的章节数(对于不按章节显示,而是按照固定长度切分的论文,每一段落为一章节).

3.1.5HCCA),尾部重合文字数(ECCA)

首部重合文字数指学位论文前1万字中重合的文字数量.尾部重合文字数是指除去前1万字,剩下的部分中重合的文字数量.对于学位论文,一般开头部分均是综述性的报告介绍,其重要性远低于论文尾部.

3.2子检测指标

对于学位论文的每一章节,

1 2 3

学术不端类有关论文范文数据库,与期刊发表文字数云南相关毕业论文致谢参考文献资料:

博士论文写不出来

统计论文怎么写

写一篇议论文

产科论文怎么写

怎样写好博士论文

如何写一篇好的论文

咋写论文

时事论文怎么写

议论文作文怎么写

怎样写高中议论文

期刊发表文字数云南WORD版本 下载地址