当前位置 —论文医学— 范文

数据库类论文范文,与基于双向聚类方法的中医治疗中风病方剂配伍规律知识发现相关论文的格式

本论文是一篇数据库类论文的格式,关于基于双向聚类方法的中医治疗中风病方剂配伍规律知识发现相关开题报告范文。免费优秀的关于数据库及中医药及中医方剂方面论文范文资料,适合数据库论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。

摘 要:目的深入探索方剂的制方要素,总结方药证治规律,找到对其中药理起关键作用的核心药/药组,为方剂配伍理论研究、药性理论研究、中医临床用药研究提供新方法和现代技术手段.方法从《中国方剂数据库》和《方剂现代应用数据库》中获取治疗中风病的方药文本数据源,经预处理、信息抽取后构建方药矩阵,引入双向聚类方法对方-药两方面数据同时聚类.结果预处理后得到有效记录648首,共计6913味药,生成了100×648“方-药”矩阵,最后得到4组聚类指标,高描述度代表方共8首,总结出针对不同证型配伍用药特点及各证型辨证论治的治则治法及各型常用药对药组.结论本方法适用于中医方剂数据库中方-药知识发现,可有效抽取所需方药信息,梳理出方药证治规律.

关 键 词:中风;方剂;配伍;数据挖掘;双向聚类;聚类分析;知识发现

DOI:10.3969/j.issn.1005-5304.2013.11.007

中图分类号:R2-05;R277.733文献标识码:A文章编号:1005-5304(2013)11-0016-04

医学信息量的不断增长催生了一项目前在医学信息学领域的活跃分支——医学数据挖掘/知识发现.在该领域中,聚类方法是一项核心技术,是探索性数据分析和模式发现的一种重要手段[1].聚类分析是一个将数据集划分为若干类的过程,其结果是使得同一类内的对象具有较高的相似度,而不同类中的对象是不相似的[2].在统计分析和模式识别领域,聚类已被广泛研究,提出了大量的理论和方法,并取得了丰硕的研究成果[3].

基金项目:辽宁省教育厅科研课题(L2012345)

双向聚类(biclustering)源于Hartigan[4]提出的同时聚类算法,是一种对数据矩阵中的实例和变量同时进行聚类的新型数据分析方法,可同时使用对象及其属性来提取它们的联合信息,对稀疏和高维矩阵尤其有效,在应用上具有很多优势[5].该方法在生物医学领域的首次应用见于基因表达谱的分析,随后在微阵列和生物信息学中得到广泛应用[6-8].而将双向聚类方法应用于中医信息分析则刚刚起步,相关研究较少,笔者以中风病中医治疗组方配伍规律知识发现为例,对该领域内方-药两方面数据进行双向聚类,在对复方聚类的同时反映其配伍信息,以揭示其组方配伍规律.


本文地址 http://www.sxsky.net/yixue/010155834.html

1资料与方法

1.1数据来源

源数据采自中国中医科学院中医药信息研究所开发的《中国方剂数据库》和《方剂现代应用数据库》.预处理采用BICOMB(http://.science./m/user_content.aspx?id等于300020),双向聚类分析采用gCluto(http://glaros.dtc.umn.edu/gkhome/cluto/gcluto/overview).

1.2数据采集

登录中医药在线(.cintcm.)多库融合平台,检索策略为“主治等于中风”,年代不限,命中记录情况为《中国方剂数据库》中1758条、《方剂现代应用数据库》中91条.套录后转换为文本格式的待处理源数据.

1.3数据预处理

纳入资料标准:主治病证中明确出现针对中风、半身不遂、偏枯、神识昏蒙、言语蹇涩、口眼歪斜及其同义词或近义词等主症,或与已知的中风病因病机符合的方剂.排除资料标准:所治症状可明确为其他因素所引起偏枯、偏瘫等,无主症或主症不符合,以及属于治疗外感表证和类中风的中风方剂.

经标准过滤及整理后,共得到有效记录648条.首先对文本进行处理得到方名和药物组成两项信息,再对部分药名后不相关信息进行清洗,最后对药名进行规范和统一.本文涉及的中药异名,主要参考《中药学》[9]及《中药大辞典》[10]进行规范处理.

1.4信息抽取

使用BICOMB的提取功能[11]进行方名和药名的识别和抽取.通过频次分析,初

关于基于双向聚类方法的中医治疗中风病方剂配伍规律知识发现的开题报告范文
数据库类论文范文
步归纳出不同药物在诊疗中使用情况.为确定核心药频次阈值,使用Donohue[12]根据齐普夫定律推导出的高频低频词界分公式进行计算.

其中,I1为词频为1的词个数,T为高频词中的最低频次数.再使用BICOMB系统的进行药方和药名统计,构建“方-药”向量矩阵,矩阵的行为高频药名,列为相关方号.

1.5双向聚类

采用gCluto对上述矩阵的行和列同时聚类.将之前导出的高频矩阵导入gCluto中,聚类算法采用重复二分法(repeatedbisection),类数量设置先后测试了从10(默认)到2,本着ISim(表示类间的紧密程度)尽量高而Esim(表示类间的离散程度)尽量低的原则,经对比发现4类效能最佳.相似性函数(similarityfunction)采用相关系数.判别函数(criterionfunction)采用I2.

聚类结果的类内和类间特征以描述度和区分度属性表示.根据各类对象中描述度(descriptive)较高同时区分度(descriminating)较低的原则来筛选效能最佳的各类代表方,作为方证对应判别的主要依据.

2结果

2.1预处理结果

预处理后得到有效记录648条,如:NO.1[方名]化风丹.[药物组成]白附子,天麻,羌活,防风,抚芎,人参,陈皮,石菖蒲,荆芥,甘草.NO.2[方名]化风丹.[药物组成]白附子,天麻,防风,荆芥,羌活,独活,人参,细辛,川芎,木香.NO.3[方名]化滞丸.[药物组成]荆三棱,蓬莪术,桔梗,大黄,陈皮,半夏,白术,旋覆花,鳖甲,葶苈子,紫苏叶,木香,沉香,麦芽,槟榔,舶上茴香,硼砂.

2.2统计结果

Cluster0类:191号方-龙珠丹(描述度2.3%):[药物组成]川乌,虎骨,牛膝,败龟,全蝎,白芷,附子,枫香脂,踯躅花,独活,藿香叶,僵蚕,麻黄,当归,白花蛇,地龙,萆薢,金毛狗脊,天麻,川芎,凌霄花,犀角,没药,朱砂,牛黄,麝香,乳香,龙脑.Cluster1类:567号方-再造丸(描述度7.8%):[药物组成]蕲蛇肉,全蝎,地龙,僵蚕,穿山甲,豹骨,麝香,水牛角浓缩粉,牛黄,龟甲,朱砂,天麻,防风,羌活,白芷,川芎,葛根,麻黄,肉桂,细辛,附子,油松节,桑寄生,骨碎补,威灵仙,萆薢,当归,赤芍,片姜黄,血竭,三七,乳香,没药,人参,黄芪,白术,茯苓,甘草,天竺黄,制何首乌,熟地黄,玄参,黄连,大黄,化橘红,青皮,沉香,檀香,广藿香,母丁香,冰片,乌药,豆蔻,草豆蔻,香附,两头尖,建曲,红曲.

Cluster2类:341号方-独活汤(描述度5.8%):[药物组成]独活,芍药,远志,薏苡仁,甘草,麻黄,丹参,陈皮,熟地黄,桂枝,菊花,人参,防风,茯神,山萸肉,天门冬,厚朴,牛膝,五加皮,羚羊角,麦冬,山芋,白术,秦艽,黄芪,川芎,附子,石膏,升麻,防己,地骨皮,石斛.

Cluster3类:207号方-夺命还真丹(描述度3.0%):[药物组成]天麻,人参,木香,白术,菟丝子,藁本,独活,川芎,僵蚕,黄芩,全蝎,半夏,熟地黄,蔓荆子,甘草,桂枝,生地黄,地骨皮,薄荷,黄连,菊花,防风,茴香,知母,杜仲,茯苓,柴胡,桔梗,陈皮,枳壳,石膏,当归,羌活,白芍,麻黄,细辛,蛤蚧,金箔.

gCluto生成的可视化矩阵中,水平方向为高频药物聚类,垂直方向为这些药物的方聚类.方药矩阵中的四类树结构对应生成的山峰图见图2.

3讨论

3.1方药对应判别

将高描述度代表方和该类结果中的高区分度方进行药物组配比对,并结合可视化矩阵的类内药物聚类树结构分布,挖掘该类方中的核心药/药组,最后查阅文献进行方解和功效分析,梳理出方药证治规律.

以Cluster0为例,将191号方-龙珠丹与类内区分度最高的341号方-独活汤进行组配比对,得到独活、牛膝、麻黄等药物为非该类代表药,排除在外.方解如下.

191号方-龙珠丹出自《杨氏家藏方》卷一,316号方-金汞灵丹出自《续易简》卷四,此二方都有祛风化痰、活络通经、开窍止痉的

1 2

数据库类论文范文,与基于双向聚类方法的中医治疗中风病方剂配伍规律知识发现相关论文的格式参考文献资料:

医学期刊目录

有关口腔医学论文

前列腺增生护理论文

护理核心论文

基础护理论文

全科医学毕业论文

临床医学系毕业论文

口腔本科毕业论文

医学论文英语

护理论文上消化道出血

基于双向聚类方法的中医治疗中风病方剂配伍规律知识发现WORD版本 下载地址