当前位置 —论文写论文— 范文

关于序列类论文范文资料,与深圳杯数学建模夏令营文集相关本科毕业论文

本论文是一篇关于序列类本科毕业论文,关于深圳杯数学建模夏令营文集相关毕业论文开题报告范文。免费优秀的关于序列及数学建模及生物学方面论文范文资料,适合序列论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。

.1996.

[3]刘祖洞.遗传学(第二版.高等教育出版社:.1991.

[4]姜丹.钱玉美.信息理论与编码,中国科学技术大学出版社.1992

[5]王玲玲等.常用统计方法.华东师范大学出版社.1994.

[6]陆璇.应用统计.清华大学出版社.1999.

DNA序列中的结构与简化模型

孟大志

(北京工业大学,北京100022)

摘 要:本文简述2000年全国大学生数学建模竞赛A题的科学研究背景,以及题目的立意和

设计.进而对解答A题的大学生们的出色方法进行介绍与评述.

1引子

这是我第一次参与全国大学生数学建模竞赛,深深地被这一十分有意义的赛事蒸蒸日上的发展所鼓舞,为在赛事中涌现出来的青年学生们聪明才智和对科学强烈的热爱而惊喜,为自己在这次参与中学到的和感受到的十分有益的影响而兴奋.2000年7月清华的唐云教授约我为竞赛出一道题,出于个人兴趣,也出于希望青年学生更关注在重大科学问题中运用数学和发展数学,于是就在全世界被人类基因组计划的成果掀起的巨大热潮中,找一个题目,以期诱导有志青年投入这一二十一世纪的科学热点中.我和领导建模比赛的全国组委会的一些教授们(叶其孝,姜启源,王强,唐云等)共同讨论了这个题目,反复修改和润色,希望更适合中国大学生的实际.但一直担心这样一个热点科学中引出的问题,一个开放式问题的太大的自由度是否会为难青年学生.结果出人意料,特别是重点大学的参赛队,十分热烈地选择A题作为他们一显身手的考卷,而且答出了同样出乎意料的水平.然而在A题的理解,解法及评判的一系列问题中,仍有许多问题需要明确,于是我应组委会之邀,特写此文力窥全豹,也对参与竞赛的师生们作一个交待.

2A题的背景

2000年6月26日,"人类基因组计划"规定的禁发时间(EMBARGO)北京时间18:00刚过,新华社,法新社,美联社,路透社等各国新闻发布机构以第一条消息发布了人类基因组草图绘就的重要消息.美国总统克林顿在白宫举行的庆祝仪式上表示,人类基因组草图是迄今"人类所绘制的最为奇妙的图谱",英国首相布莱尔说:"这是21世纪第一项伟大的科技成就等医学科学领域一场革命,其意义远远超过抗生素的发现",日本首相森喜郎在声明中指出,人类基因组草图绘制成功,代表人类在破解自身构成方面向前迈出巨大的一步,等许多国家的元首,科技官员和着名科学家纷纷发表谈话,赞扬人类基因组草图的完成,评估这一伟大成果的意义.直到6月28日,中国主席江泽民在中央思想政治工作会议上也对人类基因组的意义作出评价并赞扬了中国科学家在其中的出色工作[1].

显然,当7月份组委会提出建模赛题一事时,顺应这一世纪科学大事,在其中构造赛题,将引导青年学子关注世界科技热点,鼓励学生敢于投身到科学重大问题中去,培养学生用数学为工具去解决科学技术问题的能力方面都具有了特殊的意义.

2003年将完成人类基因组DNA全序列的测序,它将带给人类一本"自身的说明书",这对人类认识自己,保护自身,发展新的生物产业都将是意义重大的.在许多科普读物中,将人类基因组全序列这部"书"描绘成一座巨大金矿,解读这部书就是从中发掘出无量的财富,这种比喻一点儿也不过分.生命科学称这一研究阶段为"后基因组时期"或"后基因组计划"(Post—GenomeProject),而将数学与计算机科学融人这一计划之中,又常被人称为生物信息学(Bioinformation).人类基因组研究中已经浮现出大量的数学问题,已为世界上众多数学家关注[2].作为解读基因组这一庞大计划的一个十分重要而又基础的部分,就研究基因组的结构,而其中更基础的是DNA序列的结构."结构"这个词在这里的含义是十分广泛的,也就是说,作为由A,T,C,G四个字符组成的一个有序字符串,任何呈现规律性的特征都可以称为结构.由于规律呈现范围不同,我们又可以分为局部结构与整体结构,或称小尺度结构与大尺度结构,这些结构的揭示将大大有助于人们对于基因与基因组的解读.这一点可以形象地比喻为一部100万页的书,如果我们能够知道这部"天书"的篇,章,节的结构,甚至段落,语句或词的结构都清楚了,要读懂这部书的内容就变得容易了.从这种意义上说,DNA序列的结构的研究显然是生物信息学中重要的内容之一.

本届数学建模比赛的A题是在这一世界科学发展的大背景下,作为二十世纪最后一届比赛,以翘首二十一世纪的姿态,选择基因组研究为命题的学科领域.以后基因组计划中生物信息的DNA序列结构作为课题,是/顷应时代潮流的具有前瞻性的选题,

3A题的立意

在A题设计之前,立意就很明确:源于科学实际,解法充分开放.

本题取材于DNA的结构的研究,这里的结构指的是在DAN序列中重复出现的有特征的片断,这种重复出现形成丁规律.由于结构的含义是广泛的,担心学生因此而无从下手,我们特别举出三种结构为例,其目的仅仅是为了说明,DNA序列貌似随机地由A,T,C,G四个字符组成,但它之所以有"万能"的功能,正是由于在随机的外衣下隐藏着大量的结构,正是这种结构决定了功能.因此,在生物信息学中,人们普遍相信这样一个信条:序列——结构一一功能.这一信条引导人们成功地在DNA序列中挖掘出许多与生物功能相关的自然规律.在A题中举出的三种结构是十分基础而且在科学界广泛为人们所接受的.一种是四种碱基的丰度,对于DNA序列的不同的片段常常表现出碱基丰度的差别,因此碱基的丰度往往成为区别不同序列片段的特征,第二种是三联子对蛋白质的编码,它首先由发现DNA双螺旋结构的克里克和南非的分子生物学家西德尼·布伦纳确定的,这种不重叠的三联子组成的编码区(Exon)与非编码区的交替出现形成了DNA序列中一个重要的结构.如果读者想了解这一方面的知识只要在互联网上搜索"Exon—IntronStructure",你会得到供选读的大量文献,A题举的第三个例子是所谓DNA序列的长程相关性,这一规律最早由C·K.Peng等人在1992年Nature上报导[3],此后人们研究了各种DNA长序列,分别发现了DNA序列在大尺度的范围内具有统计相关性,然而这种相关性的细节及意义至今还是一个迷.A题中举出这三种结构,也为了说明在DNA序列的结构中既有大尺度全局性的,也有局部性的,研究和发现DNA序列中的这些规律均有重要意义.

正由于这种结构的多样性和一般性,为求解A题确定了解法的开放性.虽然事实上许多试卷都把这一结构理解成为编码区与非编码区,但这种局限性的理解并没有比一般性理解结构的试卷更好些.A题定义结构的一般性,有两方面的理由.一方面希望在求解A题时对生物知识的依赖不要太多,除了最基本的DNA序列的背景外,解题中并不需要有更多的基因组结构的知识(例如,是否知道Exon与Intron并无大关系).这样做是为了在"数学建模"这一基本的专业性质下平等.第二个方面就是希望这种开放性,可以使从初等到高等的许多数学模型化方法均能对A题做出一定水平的解答.而且也希望发现一些富有创造性的,十分有效的方法.事实上,本届比赛中也的确涌现出大量富有创意的方法,实在令命题者兴奋不已.

解答方法的开放性,是A题的命题领域本身就决定了的.事实上,仅在编码区预测的文献中就有了许多不同

1 2 3 4 5 6 7 8

关于序列类论文范文资料,与深圳杯数学建模夏令营文集相关本科毕业论文参考文献资料:

帮忙写论文

怎样写地理论文

写论文指导

博士写论文

论文如何写

论文书写

怎样写博士论文

代理写论文

议论文的开头怎么写

找写论文

深圳杯数学建模夏令营文集(4)WORD版本 下载地址