当前位置 —论文政治— 范文

生物医学方面论文范本,与生物医学关联数据进展与比较相关论文开题报告

本论文是一篇生物医学方面论文开题报告,关于生物医学关联数据进展与比较相关毕业论文提纲范文。免费优秀的关于生物医学及数据库及数据方面论文范文资料,适合生物医学论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。

340;工具,它可以将关系型数据库发布为关联数据.另外,国外面向生物医学领域应用的关联数据开发取得了快速的发展和成果,如加拿大的生物医学知识融汇项目Bi02RDF,此外,还有欧洲的生物医学领域语义集成知识平台LinkedLifeData,这些数据均被发布在Web上供生物医学领域科学研究和应用的共享.

3 当前生物医学关联数据研究进展

3.1 生物医学关联数据基础研究与建设情况

生物医学关联数据基础研究与建设情况主要探讨关联数据在生物医学领域的研究内容和建设成果等方面,即从研究与开发情况的视角来看,目前生物医学关联数据包含哪些研究项目,采用了哪些构建工具和构建方法等.

3.1.1 面向特定应用的关联数据 针对特定应用目标,选择有限个领域数据集进行集成,并建立数据集之间的映射,将组织后的关联数据联合发布,该形式的关联数据强调构建准确的数据集关系,为特定的应用服务.有代表性的如印第安纳大学的BinChen和XiaoDong等开发了Chem2Bi02RDF系统,W3C语义网医疗健康与生命科学研究组HCLSIG(SemanticWebHealthCareandLifeSciencesInterestGroup)开发的LODD(LinkingOpenDrugData)项目.

Chem2Bi02RDF.Chem2Bi02RDF系统集成了化学、生物、药物领域的数据集,构建成为面向生物化学知识发现的关联数据,其面向的应用主要是支持两个实体或概念之间的路径发现和数据挖掘.认为一对实体或概念在不同的环境下通过不同的链接路径相连通,分别承载了不同的解释和含义.Chem2Bi02RDF集成的数据集有PubChemCompound、PubChemBioassay、ChEBI、KEGG、CTD、BindingDB、PharmGKB、DrugBank、PublieQSAR、MATADOR、UNIPORT、HPRD、Reactome、DIP、OMIM、SIDER和PubMed.采用D2R将上述数据集进行RDF格式转化,并构建其之间的关联.


生物医学学术论文撰写
播放:32897次 评论:7608人

LODD(LinkingOpenDrugData).LODD就是一个用于药物发现的关联数据,该项目集成了来自多方面的药物信息,从药物对基因表达的影响到对临床试验结果的影响,包括大量的药物、临床、疾病以及制药企业相关的数据集,所有这些数据被转换成RDF格式并发布在RDF存储服务器上.LODD要解决的关键问题就是构建不同来源数据之间的关联,以实现科学研究以及解决药物相关问题.LODD发布成关联数据的数据集有:DrugBank、LinkedCT、DailyMed、DBpedia、Diseasome、RDF-TCM、RxNorn、SIDER、STITCH、Medicare、ChEMBL、WHOGlobalHealthObservatory、UnivemitvofPittsburghNLPRepository等,迄今为止,数据集一共包含800万个以上的RDF三元组,内部构建了370000个以上的RDF连接.目前还有一些相关的数据集,如ChemBlast、OMIM等,正在逐步被集成到该项目中.


本篇论文来自 http://www.sxsky.net/zhengzhi/050710662.html

3.1.2 基于领域大规模数据集关联的关联数据 在越来越多的生物医学数据集关联数据化的基础上,面向生物医学领域大规模的关联数据也取得了快速的发展,领域大规模数据集集成,将领域中尽量多的数据集联合发布,并建立数据集之间的映射,强调数据集和三元组的规模数量.领域大规模数据集集成形成了真正的生物医学WebofData,如GenomeCanada/GenomeQu6bec资助的生物医学知识融汇项目Bi02RDF,此外,还有OntoText公司与LarKC项目合作开发的生物医学领域语义集成知识平台LinkedLifeData以及W3C的LinkingOpenData项目中的生命科学部分.

Bio2RDF项目.Bio2RDF是一个大规模、分布式生物医学知识库,集成了40多种生物医学信息资源,如GeneOntology、OMIM、PubMed、GeneID、UniProt等.Bio2RDF将这些异构的数据库资源统一转化成RDF三元组的形式,每一个陈述(statement)都由一组三元组构成,共包含大约50亿个三元组,并对其建立了索引.这些异构的数据资源经过Bio2RDF转换后进行集成,通过本体映射技术,Bio2RDF搭建起了异构资源之间的链接,并在Web上统一发布.经Bi02RDF转换并集成的生物医学资源及其Triples和SPARQL访问接口见图1.

LinkedLifeData项目.LinkedLifeData集成了25种生物医学数据资源,共包含40多亿个三元组,是一个支持异构数据操作的平台,支持数据间的语义集成,同时提供知识访问和管理工具,完全支持W3C的标准和推荐.集成的数据均采用RDF数据模型,知识内容涵盖基因、蛋白质、通路、靶标、疾病、药物、患者等.LinkedLifeData开发的一个重要目标就是在集成的数据集上进行推理,同时避免数据冗余,并能够推荐新的链接关系,或在已知数据集上推导出潜在的知识.支持大规模数据集的应用也是LinkedLifeData项目的目标之一,其所集成的生物医学资源包括DiseaseOntology、EntrezGene、linkedCT、PubMed、UMLS等,部分资源如图2所示:

LinkingOpenData(LOD)项目的生命科学部分.LinkingOpenData项目自2007年提出以来,在过去几年中,越来越多的数据提供者和Web应用开发者将他们各自的数据发布到Web上,并且与其他数据源关联在一起,形成一个巨大的数据Web.截至最新数据发布时间2010年9月,已发布的关联数据规模为28562478988个RDF三元组以及3957

关于生物医学关联数据进展与比较的毕业论文提纲范文
生物医学方面论文范本
56083个RDF关联关系.其中,生命科学是重要的组成部分,共包含42个数据集,2664119184个RDF三元组以及200417873个RDF关联关系.观察这42个数据集发现,生物医学领域核心的数据集大多已按照关联数据4原则进行转换,并发布于Web上,支持访问和共享.这些数据集有GeneOntology、HomoloGene、KEGGCompound、KEGGDrug、KEGGGlycan、KEGGPathway、KEGGReaction、PubMed、UniProtKB、Bi02Chem2RDF等.目前LOD项目的生命科学部分大部分来自Bi02RDF、LODD和Neuroeommons,也包含一些个人和组织提交的资源,如图3所示:

3.2 生物医学关联数据应用研究进展

生物医学关联数据应用研究进展主要探讨关联数据在生物医学领域的应用方向和研究案例,本文归纳的主要应用方向有知识发现、语义标注等,其他方向的应用正在逐步推进中.

3.2.1 知识发现在生物医学领域,关联数据为知识发现的研究提供了更大的空间.基于Chem2Bi02RDF,BinChen等研究者以老年痴呆症为目标,实验发现所有的“化学制品一疾病”关联,作为实例层的关系,共发现81077种不同的化学制品和老年痴呆症有关系,其中410个通过特定基因建立桥接.如美国马里兰大学和委内瑞拉西蒙玻利瓦尔大学的Mar'la-EstherVidal和LouiqaRaschid等共同开发的BioNav,是一套从关联数据云图中发现潜在语义链接的框架和系统,BioNav基于本体技术,可以有效地发现药物和疾病之间的潜在的、新颖的关系.BioNav通过探索大规模的关联数据云图并采用本体和现有的排名技术,对返回的链接进行分析,获取排名靠前的链接.实验证实BioNav可以发现大部分的有效关系.

3.2.2 语义标注 随着越来越多的资源被发布成关联数据,关联数据在文本语义标注方面的应用效果也逐渐显现.生物医学领域中典型的应用如OntoText实验室的LifeSKiM项目,用LinkedLifeData对Medline中的文献进行标注,由于LinkedLifeData中集成了大规模的生物医学数据集,并构建了其间的关系,在对文本进行分词、句法识别、词性标注,规范化等处理之后,大量的实体关系可以清晰地识别出来,LifeSKIM项目就采用Entrez-Gene中的实体识别基因名称,采用NCBITaxonomy中的实体识别人体组织成分,采用SNOMED中

1 2 3

生物医学方面论文范本,与生物医学关联数据进展与比较相关论文开题报告参考文献资料:

政治思想工作论文

政治课改论文

思想政治议论文

研究生政治课论文

诚信政治小论文

初中政治论文网

思想政治论文网

高中政治学生论文

思想政治专业论文

高中政治论文题材

生物医学关联数据进展与比较(2)WORD版本 下载地址