我们为何要刺探自己体内的一小段文字,晏说它习能小得惊人?我们一定要这般狂妄自大吗?为什么不能放过这段文字,不去解读?
“好春心”是一个理由,但“谦逊”是更好的理由,而“敬畏”又勇胜一等。演化过程耗费约四十亿年的时同,才写成会日合种生物体内所拥有的DNA序列。而我们即将有能方阅读它们,方式几乎就和阅读我们人类所发明的书本一样。这幅远景有多么惊人啊!
人类基因组是人类的遗传物质(其化学本质是脱氧核糖核酸,简称DNA),包含所有的基因序列及非基因序列。人类基因位于染色体上,有三类,它们分别编码为蛋白质、转运核糖核酸和核糖体核糖核酸,其中编码为蛋白质的基因大约有10万个,它们在表现各种生理作用和生命现象中起决定性作用,是最重要的一类基因。
现在已经知道,人类的生老病死、喜怒哀乐,甚至生态环境和生物进化等都与基因密切相关。所以,着名的诺贝尔生理学与医学奖获得者杜伯克曾说:“人类的DNA序列是人类的真谛,这个世界上发生的一切事情都与这一序列息息相关,包括癌症在内的人类疾病的发生都与基因直接或间接有关…”
现在的基因概念更加具体了,它是DNA分子中一段能表现生理功能的序列。由于基因与人类生活和生存关系最为密切,出于人类对自身的关心,对人类基因的研究和应用始终成为基因研究的中心,特别在医学领域。临床医生经常会遇到这样的情况:在某些家族中徘徊着某种疾病的“幽灵”,使这些家族内部一代一代发生着某种相同的疾病。
现已清楚,这个“幽灵”就是致病的基因。致病基因是由正常基因经变异而形成的。由于此类疾病具有明显的遗传性,故称为遗传病。现已发现由致病基因引起的遗传病有6000余种,它们也称单基因病,因为主要的致病“幽灵”——致病基因只有一个。阐明单基因遗传病的基因原理是基因研究的重大突破。随后,人们很快明白,实际上人类所有的疾病都是基因病,除上述单基因病外,还有多基因病,如恶性肿瘤、心脑血管病、精神神经性疾病、糖尿病、风湿病、免疫性疾病等等,另外还有获得性疾病,由清原微生物侵入人体所致,如艾滋病、乙型肝炎、结核病等等。更重要的是,科学家发现,不论单基因病还是多基因病,在发病过程中实际上都涉及很多基因的作用,只是被涉及基因的作用有主有次,有前有后。这一发现使科学家在基因研究的观念上发生了根本性变化,认为欲搞清任何一种疾病发生发展的机理或某种健康状态的机理,必须从基因组层面上搞清涉及疾病或健康状态的所有基因的变化规律,而不只是研究某个基民由此孕育出人类基因组计划这一伟大的科学工程。科学家认为,人类基因组计划是与曼哈顿原子计划、阿波罗登月计划并称的人类科学史上的重大工程。该计划于1990年首先在美国启动,后有德、日、英、法、中等国的科学家先后正式加入。
人类基因组计划的产生与“肿瘤计划”的搁浅是分不开的。美国从70年代起启动了“肿瘤计划”,但是,不惜血本的投入换来的是令人失望的结果。人们渐渐认识到,包括癌症在内的各种人类疾病都与基因直接或间接相关。测出基因的碱基序列,则是基因研究的基础。这时,科学家们面临两种选择:要么“零敲碎打”地从人类基因组中分离和研究出几个肿瘤基因,要么对人类基因组进行全测序。1986年3月,杜伯克在美国《科学》杂志上发表了一篇题为《癌症研究的转折点:测序人类基因组》的文章,这篇短文后来被称为人类基因组计划的“标书”。杜伯克说,正确的选择是对人类基因组进行全测序,这样大的项目也应当由世界各国的科学家携手完成。
杜伯克以高瞻远瞩的眼光提出的“人类基因组计划”,在世界范围内产生巨大反响。
由于人类基因组计划规模太大,在美国,引起了广泛的争论,有人说,人类基因组计划是用纳税人的钱开玩花,30亿减基对是30亿美圆排出来的等等。当时,连现在用的测序仪还没有出世。因此有人说,应该先搞小的基因组,比如细菌、果蝇;或者搞经济价值大的像猪、羊等。
再者,在人类基因组计划出现的时候,其他计划,比如肿瘤计划、克隆计划、基因表达、神经活动的研究等都面临突破,因此很有可能成为科技的“花魁”。但是在激烈的辩论中,人类基因组计划不断完善,决策部门不断考虑各方意见,最后认为人类基因组计划是最重要的。因为人是最重要的,社会对人也最关切。人类在进化和与疾病作斗争的过程中,对自身的遗传变异和疾病有了较大的积累,也为研究自身提供了材料;人类基因组问题解决了,可以直接运用于解决其他生物基因组问题;另外,从人类基因组计划获得的经济价值最大。
美国政府为了使普遍民众了解人类基因组计划,印发了不少小册子,诸如《人类基因组计划有多大人阿解我们的基因》。使人类基因组计划成为美国历史上规模最大参与人数最多的科学普及工作。人类基因组计划的目标也经过反复讨论,数易其稿,最终对每一部分都有定质、定量、定时的具体目标。
1984年12月,美国犹他大学的魏特受美国能源部的委托,主持讨论了DNA重组技术及测定人类整个基因组DNA序列的意义。1985年6月,美国能源部提出“人类基因组计划”
的初步草案。1986年6月,在新墨西哥州讨论了人类基因组计划的可行性,随后美国能源部宣布这个草案。在纽约冷泉港讨论会上,诺贝尔奖金获得者吉尔伯特以及伯格主持了“人类基因组计划”的专家会议。1987年初,美国能源部与国家医学研究院为人类基因组计划下拨了启动经费550万美元。1987年总额年1.66亿美元。
1987年,美国开始筹建“人类基因组计划”实验室。1989年,美国成立“国家人类基因组研究中心’,诺贝尔奖金得主、DNA分子双螺旋结构模型的提出者詹姆斯·沃森担任第一任主任。
1990年,美国国会批准美国的“人类基因组计划”在10月1日正式启动。其总体规划是准备在15年内至少投入30亿美元,进行对人类的基因组分析。
1993年,美国对这一计划做了修订,主要内容包括:人类基因组的基因图的构建与序列分析;人类基因的鉴定;基因组研究技术的建立;人类基因组研究的模式生物;信息系统的建立。这其中的最重要的任务就是人类基因组的基因图构建与序列分析。最重要的是这样几张图:遗传图、物理图、序列图,最优先考虑、必须保质保量完成的是DNA序列图。
除了美国以外,世界其他国家也开始了基因测序工作。值得注意的是英国。1989年2月,英国开始了人类基因组计划。它提出全国协调、资源集中的任务。全国有关的实验室统一从“英国人类基因组资源中心’获得免费实验技术和实验材料服务。自1993年开始,伦敦的桑格中心成为全世界最大的测序中心,它独立完成了人类基因组30%以上的测序任务。
法国对人类基因组计划的贡献在3%左右。它的“国家人类基因组计划”于1990年启动,由科学研究部委托国家科学医学科学院制定。1983年年底,诺贝尔奖金获得者道赛特以自己的奖金建立了人类多态性研究中心。法国民众至少捐助了5000万美元。人类多态性研究中心和相关机构为基因组研究,尤其是第一代物理图与遗传图的构建做出了不可磨灭的贡献。
日本对人类基因组测序的贡献占了7%。是在美国的推动下于1990年开始的。此外,加拿大、丹麦、以色列、瑞典、芬兰、挪威、澳大利亚、新加坡、前苏联和东德也都开始了不同规模、各有特色的人类基因组研究。
中国的人类基因组计划于1993年开始,成为国家自然科学基金委员会、国家高技术计划、和国家重点基础研究计划共同资助的“重大项目”。由着名遗传学家组成了这个项目的顾问委员会,由中青年科学家组成学术专家委员会;还有一个“中国人基因多样性委员会”和“社会、法律、伦理委员会”,另有一个秘书处负责国际联络、国内协调与日常事务。
我国是一个人口大国,占世界人口总数的22%,而且还是多民族的群体。我国丰富的人群遗传资源是研究人类基因多样性、人类进化和人类相关疾病基因的宝贵材料。据中国人类基因组计划南方组首席科学家陈竺院士介绍:“根据我国的实际情况,中国的人类基因组计划初期目标主要是充分利用我国丰富的遗传资源,进行基因多样性和疾病基因识别的研究。在过去的几年中,中国组织了一批高水平的医学一中心和遗传学领域内的国家和部门重点实验室,建立了全国性的遗传资源收集和保存网络,引进和建立了包括遗传和物理作图、大规模DNA测序、基因定位、克隆、突变检测和生物信息学等在内的较完整的基因组研究体系。也获得一批重要的研究成果。在基因多样性领域,建立了多民族人群的DNA样品库,对中国南、北30个民族和人群的遗传关系进行了研究,并与世界15个参考人群进行了比较,研究结果显示,中国人群可以分为南、北两个大组,两者之间有明显的基因融汇;东亚人群可能起源于东南亚,而东亚现代智人与其他各大洲现代人群都起源于10-20万年前“走出非洲”(通过对现代各人种间线粒体DNA的研究,各国人种都有较亲缘的关系,国外的一些科学家认为,所有现代人类的祖先,都是13-20万年前才走出非洲,遍布世界)的群体。另一方面,疾病基因的研究也取得实质性的进展,克隆出遗传性高频耳聋的致病基因,定位了若干单基因疾病的染色体位点。
在白血病和某些实体肿瘤相关基因的结构、功能研究方面。取得一批具有国际影响的成果。近年来,在多基因疾病的定位方面也取得初步成功。此外,一些实验室在人类功能基因研究方面也实现了突破,已经获得来自血德一免疫。神经一内分泌、心血管系统以及肝脏的Egy10万多条,克隆了1000条以上的新基因的全长tiDNA。”
四张图:物理图、转录图、遗传图、序列图
“人类基因组计划”是解读人的基因组上的所有基因,共分析24个染色体DNA分子中的四种碱基对。30亿个碱基对是一个很长的序列,为了更好地搞清这个长序列,需要有其他辅助工作配合。在“人类基因组计划”中,分为两个阶段:DNA序列图以前的计划和DNA序列图计划。序列图以前的计划包括物理图、转录图、遗传图。
人类基因组的物理图有两个要素:一是序列,二是位置。在如此长的序列中,物理图就像地图一样标明各个序列的路标。通过分子杂交的办法,利用DNA双链互补特点,一个DNA片段杂交在这个位置,“说明这个位置的结构与它相似,就是这个位置的标记,这是以序列作为标记的位置。”
物理图还有更重要的作用,有了前面标志的序列位置,就可以将克隆的DNA片段,一个一个接起来。据中国人类基因组计划负责人杨焕明教授说:“如果两个克隆的DNA片段,都含有某一路标的序列,就说明这两个片段的一部分是重叠的。我们整个基因组的DNA就是由这些相互重叠的DNA片段全部覆盖。换言之,这些DNA片段,就是我们人类基因组这一区域的代表,这些片段的克隆就是我们研究这一区域的实验材料。”
物理图的绘制需要用遗传工程的手段来解决,对年代以来遗传工程所产生的技术,在制作物理图时被利用上了。其中最主要的是克隆技术和分子剪刀。
克隆技术简单说就是不经过亲代的交配,以一个个体的自身为模板复制一个自我的过程。DNA的分子克隆以生物体的细胞为载体,随着细胞的克隆自身也克隆出来。现在使用的技术是DNA片段克隆,就是说,在塑料试管里,克隆出长几百个乃至几十万个碱基对的片段,这是基因工程的基本技术。
做DNA片段克隆需要一种“载体”,最早人们采用质粒作为DNA片段的载体,它把一段段DNA拼接起来,实现自我复制。后来,又有了病毒载体、酵母载体和细菌载体。有的运载量大,有的功能稳定,有的制造容易。使DNA片段的复制手段多样化了。
基因剪接是基因工程最基本的一种手段,长长的DNA分子是一条条键,最短的第22号染色体也有3000万个孩着酸。如何把他们剪开呢?这就要用分子剪刀了。这种剪刀就是酶。它能把DNA从内部切开并能识别特殊的序列。
剪刀有两种,一种是万能的,在任何地方都能剪,另外一种是只能在特殊的地方剪开,这种剪刀叫做限制性内切酶。现在已经发现的内切酶已经有300多种。有趣的是不同的内切酸切开的链子刀口不同。在两条链子组成的DNA中,有的内功酸能把片段的切口仅成平头,有的切成换头,易于重新级结。
除了剪开DNA分子的酶,还有级结DNA分子的酶。有了这些工具,就可以进行基因剪接了。
人类基因组计划要完成的另外一个图谱就是转录图。我们说在人类大约有7一周万个基因。但这么多基因中,只有1%一5%的基因是指导蛋白质编码的。因为各种生命的现象都是通过蛋白质来表现和实现自己的功能的。因此,抓住了这些能编码蛋白质的DNA,就大致抓住了人类的基因,这就是转录图所要做的事情。
人的每个细胞里所有的DNA决定将近10万个基因,那么在每一种组织的细胞中,只有10%的DNA能表达。
转录是表达的第一阶段,DNA转录后,成为只有一根键的RNA,这个RNA携带信息,所以他被称为mRNARNA根据遗传密码决定蛋白质。因此抓住这些携带信息的mRNA就成为重要任务。可以说,转录图是基因图的雏形。
在人类基因组计划中,DNA片段的部分序列,被称为可表达的标签序列,到目前为止,在国际合作的人类基因组计划中,这些dJNA片段已经被发现了160万,这160万个经过分析和剪接,至少已经代表了上万个不同基因的部分DNA序列。
由于转录图中的这些基因是有表达功能的基因。再者,转录本身是有组织与时间特异性的,它来源于已知的某一生育阶段的某一组织,因此可以给制出在正常条件下基因表达的数目、种类及结构、功能的信息。将来还可以了解不同组织在不同水平、不同表达、不同时间内的表达,这样有了正常和异常的转录图,就可以在此基础上构建基因表达谱了。
由于这种转录的DNA,可以为DNA序列鉴定哪些部分是编码DNA提供可靠的信息,而且这是序列分析中效益最高、收获最快的方案,再者,它本身就有经济价值,可以为基因诊断或基因克隆作为工具,因此转录图的构建和从川队片段的分高竞争是十分剧烈。
美国私人公司在这方面提出共达40多万个dZNIA片段的专利申请。
遗传图是根据经典遗传学的原理,结合现代分子生物学的进展,以现象来追踪本质的重要工具。
经典遗传学的精髓是遗传分析,在基因和表现之间发现遗传的联系。经过基因组的分析,人们发现一个基因一定在基因组中有其位点,这个位点至少有两个等位基因,一个是正常的,一个是不正常的。如果这个不正常的基因不表达,这个人还是正常的,仅仅是一个携带者。这个位点和全部基因组的遗传标记存在着距离问题,如果位点接近,就会发生交换,距离较远的,交换的频率就高。科学家采用一个遗传标记,来检查家系中这个遗传标记的位点是否与致病位点发生交换。靠物理图就可以在这个遗传标志的相应距离找到这个基因。虽然疾病的原因很复杂,但是利用遗传图就可能分离到这个基因。
因此,在遗传图中,家系是一个重要分析对象。序列中的差异就成为最好的“遗传标记。”
物理图、转录图和遗传图都是序列前计划,这些图的绘制,都是为人类基因组的序列图作准备,只有序列图完成了,才能将人群内序列的差异,作为密度最高的遗传标记来完善遗传图,因此序列图是人类基因组计划中的最重要部分。
中国参加人类基因组计划的科学家在《生命大解密》一书中详细讲解了人类基因组序列图的绘制工作是如何进行的:
人类基因组DNA序列图的绘制工作,可以做这样的比喻:假说人们只穿4种颜色的衣服,红、黄、白、黑,“人类基因组计划”就相当于把世界上30亿人所穿的衣服都搞清楚,而且注明位置顺序,如所在的国家、城市、街道、楼房、房间。人类基因组DNA序列图的绘制,是在上述3张图的基础上,采用了“分而胜之”的“克隆到克隆”的策略。
科学家用已在代表人类基因组中不同区域定好位置的标记,即遗传图的“遗传标记”和物理图的“物理标记”,来找到对应的人类基因组“DNA大片段的克隆”。这些克隆都已知道是相互重叠的。再分别用机器测定每一个克隆的DNA顺序,再把它们按照相互重叠的“相邻片段群”装搭起来。
为了测定这些大片DNA克隆的序列,要将这些DNA克隆按遗传图与物理图的标记,确定在基因组中,切成1一2000核音酸长的小片段,再“装”到一种质粒“载体”上,送进细菌中克隆,大规模地培养细菌,再从细菌中提取这些“克隆’的DNA。在我国的“北京中心’,工作人员每天要制备5000一1万个克隆的DNA作为测序“模板”。这些DNA要质量上很纯,数量上准确,还不能相互混杂。
模板制备好了,就要进行测序。一第一步是“测序反应”。现在使用的方法是“酶终止法”。简单地说,是以要测的DNA为模板,重新合成一条新链,分别用不同颜色的荧光物质标记上。这样,如果一段序列的一个位点上是A,就将代表A的劳火物质标记在A的后面,由此类推。这样就形成了长度相差一个核着酸的新的DNA链,而结尾一位则可以荣火的颜色来决定是:或地或t、或动或G。
测序反应做好后,第二步是上‘咱动测序议’分析。现在的机器主要有两类,一类是“凝胶电泳”,另一类为“毛细管电泳”,它们都能将长度仅相差一个碱基的DNA片段—一分开,由于不同的片段尾巴的核着酸已标有不同颜色的荧光染料,可以很直观地读出A、t、C、G的序列。
这些“序列”通过电脑加工、检查质量,再用一些特殊的电脑程序,将相互重叠的序列装搭起来。要确定每一位置的核音酸,至少要测定5一10次。如果中间有“空洞”,还要将这些“空洞”用各种技术“补”起来,最后形成一个大片段克隆的完整序列。这些序列片段再根据“相邻片段群”的信息装搭起来,就组合成了一个染色体区域,一个染色体完整序列。
现代的基因组技术是分子生物学、遗传学、遗传工程技术、生物信息学的综合。由于整个生命科学已进入“以序列为基础的时代”,大规模基因组测序、组装与分析技术已成为生物产业最重要的“龙头”、上游技术,这是一个国家的国力、技术能力、新的科研型企业的管理能力、人的素质的最集中的表现。”
一个基因的克隆,就能形成一个基因的产业,这不是天方夜谭。大多数外国医药公司,都在向基因方面投入巨资,而且规模扩张非常快。比如一个肥胖病的基因转让费就要1.4亿美元。
由于人类基因组计划,已经形成了一个人类基因组工业。到了这个阶段,高等生物被用来作为生物反应器。这些生物的基因组很复杂,如果把外来的遗传工程基因放进去,他们会产生免疫反映,排斥外来基因。但是外来基因与本身基因组的基因之间会产生相互作用,外来基因的产物蛋白质也可能会影响这个生物的很多反应。因为在生物发生器中的某些基因需要高度表达,这就必须了解这个生物反应器的整个基因组,了解基因与基因之间的关系,因此产生了基因组产业。
基因组工业最成型的技术中有转基因技术。比如用牛。羊、猪当作生物反应器,来生产人的红细胞促生素。用鸡生产人的血清白蛋白。这是把人的血清白蛋白基因的结构部分接到鸡的血清蛋白上,使原来鸡蛋的血清蛋白大部分变成人的血清蛋白。这样能生产人的血清蛋白的鸡自然比普通的鸡高出许多。
转基因技术还可以把牛变成转基因牛,可以用它来生产出和人奶相同的牛奶,也可以生产出红细胞生长素。目前全世界所用的红细胞生长素只有几公斤,但是一头转基因牛年产就能达到柳一肥公斤。目前转基因的牛羊已经从奶里提取出了几种人的基因产物。
转基因技术还可以生产出人的器官。在医学史上,20世纪的突出进展就是器官移植技术。随着外科技术和免疫技术的发展,现在人类可以进行各种各样的器官移植。比如角膜、肾、心脏、肝。备用的人体器官成为紧缺商品,世界上数以万计的人等待着器官移植。在这种情况下,科学家想出了把人的器官转移到另一种动物身上的办法。让它长出人的器官。最早用猪来进行这种生产,因为猪和人类在进化上是近亲,猪的心和肾和人的心、肾的构造差不多。大小差不多,而且生长期只有10个月。过去说人蠢是猪心,现在转基因的猪心要被用来进行人的器官移植了。当然要真正做到这一点,还要解决异种心脏的排斥问题,必须把猪的心脏也换成人的,不要把猪的心脏发育、功能有关的基因也换成人的。
在植物方面,转基因的各类水果、粮食已经出现,美国已经搞了“食品基因组”,一方面要把动植物的基因组搞清楚;二是在此基础上,寻找出新的种质,也就是说,要找出新的基因资源。人类在20世纪开始的绿色革命,目的是寻找新的物种来生产足够多的粮食养活全人类,现在的食物基因组计划,将使人吃得更好。并解决人口增长、农业资源相对缺乏、生态环境恶化,彻底改变农场的定义。
在今年五月份北京高科技讨论会生物科学的讨论中,有科学家用形象的画面展示出未来鱼类生产的前景,在北京郊区的几百公顷的土地上建立的养渔场,采用基因技术,可以使它满足全北京市上千万人口的吃鱼问题。
随着人类基因组计划的发展,也使得原先技术发展方向不明的生物芯片技术得到了新的动力,在为人类基因组计划服务的过程中,它为自身的发展开辟了广阔的前景。
克隆技术是在前两年得到突破性进展的生物技术,英国科学家克隆出第一头羊,以后又有其他动物被克隆出来。华裔科学家杨向中说;“克隆技术对下一个世纪生活方方面面的影响,在医药、卫生,因此,在美国有人把生物技术和原子能技术相提并论。但克隆技术一方面给人类带来利益,另一方面是恐怖。中国人关心的是克隆出来的人在辈分上怎么算,西方人关心的是克隆人和上帝作对。克隆技术是可以复制出一组动物、植物和微生物的技术。原来我们插下一根树枝就可以成活,这是一种克隆。在人类,同卵双生也是一种克隆,因为遗传信息是一样的。克隆在自然界本来就存在,直到1997年,英国出现了多利羊,大家对克隆才有所了解,成为家喻户晓的动物。对动物克隆研究来说是一个福音。”
杨向中还说:几年前,提出2003年,我们人类身上有多少基因,基因图谱,基因的定位就会实现。几个月之前,科学家就人类基因组的工作进展神速,克林顿说今年年底,人类基因组的定位将要完成,但就在几周之内,美国的一个公司宣称人类所有基因的测序几周之内将被定位,我们知道基因的位置虽然很重要,但是更重要的是这些基因是干什么用的。克隆技术将在研究基因的功能方面发挥重要作用。研究可以治病的基因。
珍稀动物保护组织来信祝贺科学从动物皮肤细胞克隆,为珍稀动物保护带来好消息。
现在不管你是赞成克隆还是反对克隆,将来克隆肯定要影响到人类生活的方方面面。
人类基因组计划以后还要带动其他生物基因组计划的发展,比如中国已经开展的水稻基因组计划,由于人和所有动物、植物、微生物都是远亲近成,人类基因组计划在研究人类这一最高级、最巨大、最复杂的生物基因组的一整套策略、技术,都可以用来研究所有其他生物的基因组。
也正因为如此,生物革命的发展,改变了生物资源的存在形态。原先要搞到一个品质好的生物品种,比如良种牛,或者某种珍贵植物,需要出口或走私。现在则用DNA技术与基因分析、克隆技术将这头好牛,或者珍贵植物的DNA克隆出来就行了。只要把这些牛测个序,或者只测量和长肉有关的相关区域,就可以通过互联网传回国。到目前为止,我国的一些生物资源就这样无声无息地流失掉了。
基因组测序技术,将个体的生物资源升级为DNA资源和基因组信息资源。对每一个民族的生物资源保护与开发,都是一种新的挑战。
由于基因巨大的经济利益,它立刻引来了许多贪婪的目光。人类基因组计划巨大的经济价值,使得在人类基因组研究进程中,有过两次逆流,几乎彻底倾覆了人类基因组的研究计划。但是由于坚持人类基因组计划精神的主流科学家的正义态度,使得人类基因组计划在斗争中不断加速,演出了一场主流科学家和私营公司之间的激烈竞争。
人类基因组计划的第一仗就是专利战争。专利对近代科学的发展起过巨大的促进作用,这是对科学家知识产权的保护,也保证了公众对发明的了解和运用。但是,人类基因组为每个人所共同拥有,不是哪一个人的专利,因此着名人类遗传学家福格尔谴责“基因专利”是全人类的一场噩梦。
由于基因研究投入巨大,克隆一个疾病基因就要投入上亿美元。其潜在的商业利润也惊人,按照有投入就有回报的商业逻辑,对功能明确的基因有人申请专利,但是更有人对功能尚不明确的基因也要实行专利。现在已经颁布了1200个人类基因的专利,已经造成了既成事实。只能在转让费和专利期限上讨论问题。
因为人类基因是有限的,发现一个就少一个,因此,基因资源的争夺是残酷的争夺。
失败者只有用别人的专利进行生产。而没有专利,就无权进行生产。
如果基因序列也被允许专利,其后果是严重的。信息垄断所导致的结果,只能是几家大公司主宰,谁要是享用这些信息,都要向他申请许可。
在人类基因组计划的进程中,发生过两次逆流。这两次逆流都与新的测序仪的发明有关。我们知道,人类基因组计划测序开始时,连测序机都没有,到了1992年,PE公司推出新的测序仪ABI373,一次能读出几百个核着酸序列,这样就可以大规模地分析ESt。
因此,美国国家医学研究院的一个科学家便申请专利,而且得到了前任院长的支持。
1991年,美国国家医学科学院递交了第一个ESt的专利申请。这一举措立刻遭到美国主流科学家的反对。在强大的压力下,专利申请被撤消。但是美国的一家公司“史必公司”
却用巨资支持这位科学家与世界基因组组织的科学家作对。由此出现了两大阵营。在道义论争的同时,史必公司凭借其经济实力与世界基因组组织的科学家对抗。他们在投入巨资加速专利的生产,并且建立起自己的ESt数据库,与公众数据库抗衡,并且几次领先。同时在一些第三世界国家建立生产ESt的分实验室。
国际基因组组织的科学家也以最快的速度分离ESt,使公共基因库的ESt序列日益增多,而且将测出的序列尽快上网,造成公开的既成事实。同时靠法律手段、舆论工具、道义力量据理力争。
在专利申请上,也是一波三折。美国专利商标署1997年曾经考虑给IISI’颁发专利。
舆论大哗。美国国家医学研究院强烈表示反对。1994年,美国国家医学研究院在撤回将近7000个ESt的专利申请对,明确表明,对功能与实用意义不明确的不完整或完整的基因序列申请,不符合公众健康与科学的最大利益。对专利商标署的ESt的实用价值的定义,进行全面抵制,认为这将会给科学家能否尽早享用序列信息带来问题。
世界基因组组织强烈要求专利商标署撤回Egr专利的决定。美国的一些科学家与史必公司决裂。所有序列一经测出,立即公开,公共数据库的扩增速度保持正常。
1998年,随着新的测序工具的出现,出现了第二次逆流。5月三叉口,PE公司推出了新一代的“毛细管测序义’,使测序的工作提高了许多倍,自动化程序也高级得多。
但是这家公司首先将300台机器自己使用,并且投资3亿美元,让原来那位美国国家医学研究院的科学家专门成立了赛来拉公司,号称要在3年内用新的方法完成人类基因组计划的全部序列。他们说,他们只要几百个基因的专利,但是在发布的时间上和对序列的垄断上他们采取拖延的态度。他们拒绝在24小时内公布所有数据,表示要把数据分析完了,选择出最重要的基因为自己所用,然后对这些选择出的基因索价年使用费至少为500万美元。
国际基因组组织的科学家奋起抵制这一做法。他们认为,赛来拉公司的新策略所用的基因装配,用的是全球科学家几十年心血的遗传图、物理图,他们免费从国际公开数据库中得到这些信息,本身就不公平。再者,如果国际基因组计划就此流产。10年的心血将付之东流,许多人才会流向赛来拉公司。他们将在这个领域内肆意妄为。因此,他们一方面是计划得以继续,向政府申请经费,加速研究,与赛来拉公司竞争。
据美国《时代周刊》的一次民意调查,72%的民众不赞成几个公司“自己出钱”,完成人类基因组测序并专利重要基因,美国国会经过多次激烈辩论,听取了主流科学家的意见,保证了对hGP的继续支持。
值得注意的是,曾蓄意破坏hGP,孤立美国主持正义科学家的PE公司,专门派出各种身份的人,到有意参与“人类基因组计划”的发展中国家游说,也同样到过中国。说什么“即使全球合作,也都斗不过我们公司”,“参加测序,等于白花钱”,“数据反正是白用的,干嘛还花钱参加”……居然真影响了一些国家的决策者。
争论还在继续,1999年9月1日,在“人类基因组计划”有关“工作框架图”的最后一次策略会议的前两天,“赛里拉”居然宣布自己已完成人类基因组测序的印%,它的股票一日暴涨切美元,上升幅达四.5%。实际上他们的数据,是目前难以装塔的原始数据,离“工作框架图”相差甚远。但从另一方面,却反映了民众对人类基因组数据潜在价值的认同。
尽管“人类基因组计划”的所有资助者、所有参与的实验室,都一致同意并许诺:
“人类基因组计划”的数据,应该“平等、免费”分享,并签订了“百慕大原则”:所有数据都应在24小时内公布,但“赛里拉”等公司肯定不会就此罢休,因为,“人类基因组计划”的科学意义与经济意义实在太重大了,争持不会停止。
人类基因分离与研究的最终价值是人类疾病的预测、诊断与治疗;基因功能的鉴定,关键是与疾病等表型的联系,这就决定了基因分离一应用这两头都需要与疾病挂钩。疾病家系、人群、患者的遗传材料,成了具有科学、经济意义的基因资源。而拥有这一资源的发展中国家,成了争夺基因的“狩猎场”。
印度科学家首先挺身而出,给印度政府施加压力,要求以行政措施保护印度的基因资源。我国基因资源外流情况,比起印度,有过之而无不及。
据《今日生物世界》报道,美国西夸纳公司已取得中国一个很大的哮喘家系,随后多次宣扬这一家系的价值,以配合宣传他们的工作。中国这一家系的外流,国内学术界至今仍蒙在鼓里。
要说基因资源,中国是首富。一是中国的人多,病也最多;二是中国人几代同堂,没有天灾人祸不动窝,少数族群多生活在偏远的大山里,形成的家系最多最纯。一些基因资源掠夺者把目光投向了中国。
据美国权威的《科学》杂志1996年报道:哈佛大学“群体遗传学计划”,要在中国研究包括糖尿病、高血压、肥胖症、早发心脏病、关节炎、精神分裂症与传染病在内的几乎所有“文明病”。这一计划要用2000万中国人的血样及DNA样本,因为中国可提供廉价研究材料;巨大的人口可以使科学有鉴定功效细微的基因。这一计划要通过6个中国医学中心,而这些中心(不管刚挂牌,或还没有挂牌)的正主任则是美国这一项目的负责人,他们声称将扩大经费,而多个药物公司赞助的筛选600万中国人以研究哮喘基因的项目已经上马。
中国预防医学科学院与美国BMI等公司合作,以研究“膳食、生活方式和慢性消耗性疾病的关系”为题,在我国收集血样与有关流行病学方面的资料,计划采集50万人的血样与所有个体的体检、临床数据。此协议写道:“本项工作产生的全部知识产权全部归BMI所有,包括版权、专利。商标注册。”中方明确声明:“本项目所涉及的知识产权将为BMI所有。”为了吸引投资者和遵循国际商业惯例,此点必须在协议中清楚地表明。由于在这一商业活动中,中方并未投资,因此在知识产权方面不可能要求平等。
印度政府正计划通过立法,来限制外国研究者与药物公司获取该国的生物资源。如果没有“国家生物多样性管理委员会”批准,将具商业价值与生物资源有关的标本、数据输入国外,将受严厉惩罚,处以5年的监禁或3万美金罚金。
冰岛国会为制止掠夺遗传资源的“生物海盗”,反对“直升飞机式研究”或“取了血样便跑”的研究,立法制止人类组织样品出口。外国公司要想以冰岛人群进行研究,只能在该国国内进行,或保证让冰岛“免费”享受所有研究成果。
美国政府通过外交途径,转告外国政府:美国人在美国以外采集人类基因资源,并没有得到美国政府的批准与资助,只是个人行为。
联合国教科文组织于1995年成立了“国际生物伦理委员会”。经3年讨论,反复修改,起草了《关于人类基因组与人类权利的国际宣言》,简称《人类基因组宣言人1997年三三月五三日,经“联合国教科文组织”第二十九届会议通过。1998年11月27日又经“联合国大会”批准,成为名副其实的国际文件。
《人类基因组宣言》是历史上第一个有关科学研究的宣言。它的发表,充分反应了“人类基因组计划”可能对科学、经济、伦理、法律及社会方方面面的影响,以及就这些问题讨论的迫切性与严肃性。《植言》被比拟为1948年《人权国际宣言》与《纽伦堡法典》,其宗旨是保护人类的基因组。
《人类基因组宣言》有4条基本原则:人类的尊严与平等,科学家的研究自由,人类和谐,国际合作。
为保护发展中国家的权益,《人类基因组宣言》在历史上第一次提出与发展中国家进行国际合作、“南北合作四大原则”。由于本书(指《生命大解密》)作者授权解释与此有关的条文,因此特别强调这一部分。
1.全面解释人类基因组研究的风险与利益,防止滥用。人类基因组的研究是把“双刃剑”,由于科学认识暂时的局限性以及对技术的渴望,发展中国家的决策者与民众有可能忽视风险,在立法方面滞后。因此,决不允许以“帮助发展”、“技术领先”
的名义,在发展中国家进行在发达国家不允许的实验,转嫁风险,把发展中国家作为“侏罗纪公园”的实验场。
2.以提高发展中国家进行人类生物学与遗传学研究能力为宗旨。考虑到发展中国家的特殊问题与需要。特别是解决他们的研究能力,不能搞假合作、真掠夺特殊人群与患者的遗传材料。
对于发展中国家,提供特殊材料,是一个民族对科学发展的贡献,不能“将物自居”
拒绝国际合作,而耽误这一疾病的研究。“资源换技术”,在迫切需要技术的时候是可以考虑的。但国际间的合作,要考虑是否有助于提高本国的研究能力。本国的科研人员,有对自己的资源进行开发、利用的优先权。
在发展中国家取得资源,一定要服从该国该地的有关法律与管理法规。特别要尊重“知情同意”的权利,不能利用当地人民对科学暂时的不了解,以任何名义、手段,甚至与地方当局合作,从当事人那里骗取遗传材料。
3.国际合作应有利于发展中国家对科学技术成果的分享。由于历史原因、经济能力的限制,发展中国家对人类基因组研究没有投入,在研究规模与速度上比不上发达国家,甚至至今还没有参与,但人类基因组是全人类基因遗产与财产,因此,这绝不能影响发展中国家分享“人类基因组计划”成果的权利。只有这样,才能促进全人类的和睦和整体进步。
4.促进发展中国家与发达国家自由交换科学知识与信息。科学家相互自由交换科学知识与数据,是科学发展的根本保证,也是科研与应用的基本保证,由于人类基因组信息对全人类的重要性,更突出了自由交流的意义,保证不扩大发达国家与发展中国家在科学上的差距。
《人类基因组宣言》事关全球各国,影响千秋万代。因此,“联合国”要求所有成员国采取措施,通过各种手段,向民众、特别是科学决策者传播《宣言》的原则条文,提高整个社会对基因研究中可能涉及人类尊严的关切程度,促进这些原则的实施。
中国在国际人类基因组计划中承担了1%,这是人类3号染色体短臂上的一个约30MB区域的测序任务,该区域占整个人类基因组的1%。说起这个计划的实施,没有人能比参与这项工作的中国科学家更有发言权,现在就看看他们对这件事情的全面描述:
中国参不参与序列图绘制的国际合作,已讨论了10年。如果认同人类DNA序列图是“重中之重”,关系到21世纪我国生命科学与生物产业的基础建设,不参与序列图绘制,这一步拉开了,将眼巴巴地使我国永远失去参与的机会。
苦头我们已开始吃了,如对虾病毒基因组测定忍痛让人。一步被动,势必长期被动,全局被动,耽误国是。历史将证明,中国建立大规模的基因组序列图构建系统,只是时间的问题。越晚,我们民族付出的代价就越大。不做,就是我们的失职。历史将要追究所有人的责任,包括讨论中持不同意见的双方。因此,我国的决策部门,所有相关的研究人员,一直在沉重地、痛苦地思考这个问题。
最终中科院遗传所的“人类基因组中心”(简称北京中心)于1998年8月4日开张。
1999年2月决定搞大规模基因组测序,4月预运行,以创造加入“国际测序俱乐部”的条件。7月7h在国际人类基因组测序协作组登记,申请加人“国际测序俱乐部”。
1999年9月三日。在伦敦举行的第五次人类基因组测序战略会议上,作为新的成员,北京中心与已为人类基因组做出的卓越贡献的万个中心一起讨论战略,商议标准,界定区域,分析面临的问题,一起分享喜忧。占世界人口20%的中国,负责测定人类因基组序列的1%。
“国际测序俱乐部”听取了北京中心关于实验室面积。设计规划、设备类型及实际运行情况的数据统计;人员组成及素质、技术培训与实际运作等方面的情况介绍,以及依据设备、试剂、人员的实际投入与产出等所有数据做出的详尽预算。北京中心自信地宣布:保证中国科学院及其遗传所。中国中央政府及其他有关部门、地方政府和其他各种来源及中国民众对这一项目的财政支持,全额经费绝对能及时到位。
滴水穿崖,非一日之功。北京中心的关键设备运行情况与国际同行并驾齐驱,令人信服地说明中心人员已掌握全部的技术关键与细节,以及世界级中心的管理与动作。北京中心自豪地展示了自己测定的难度最大,投入最大,意外最多,准确率最高的区段,以及已递交的4个片段628Kb数据。这些数据,已使中国成为递交人类DNA序列数据最多的6个国家之一。北京中心对与国际同行同步,即在2000年春求完成“包干”区域的测序充满信心,并保证—半以上的序列达到“终围”的质量标准。
北京中心动最后表示:在研究过前四次“战略”会议文件的基础上,保证俗守hGP精神,特别是有关数据的即时公布与免费分享的原则。北京中心还重申反对人类基因组基本信息专利的立场,保证不保留任何数据,不申请类似的专利。
由于中国注册较晚,原定会议程序并未列入。为中国代表能及时与会,北京中心几位国际顾问四处联系,出谋划策。主要负责人最后通过越洋电话,当即决定邀请中国代表与会,各国代表纷纷祝贺。会场上数位代表或以旧交之了解,或以目睹之事实称赞中国的进步。hGP精神感人至深。在国内,基因组学界的前辈们谆谆教导,有关领导语重心长:“志在必得”兄弟院所真诚合作,地方政府鼎立支持,同仁同道倾囊相助。
截至1999年2月13日,北京中心已投入了28万余个测序反应,已完成申报投入50万个反应的一半以上,累计测定了110Mb的序列,相当于把这一区域测了3次。按国际标准,已递交国际数据库16.SMb的一致性序列,已完成了“工作框架图”的55%。2000年春求完成“工作框架图”完全有把握。国家人类基因组北方与南方中心也参与了这一项目。
除了完成“工作框架图”的任务外,北京中心已建立了完成单个BAC的序列组装的能力,已完成组装并递交了6个完整的BAC的DNA序列,合计长度的0.gMb。并建立了将几个BAC的序列组装成一个连续片段的能力,能将10个BAC克隆序列组装成三.IMb的大片段。另外,建立了数据分析与基因鉴定的能力。24小时内,在内部网络中完成全部数据的初步分析。
“1%项目”尽管还会有争议,但它的意义,已逐步显示:
1、显示了中国领导人与决策者的高瞻远瞩与英明果断。
中国参与国际“人类基因组计划”,正如国际同行与海外留学生所说的,充分显示了我国新一代领导人与决策者,对全球科技格局的了解和参与国际合作重大课题的新思维与新策略。中科院以1000万人民币的投入,创造了又一个“中国第一”,成为中国的hGP中最具影响与实际产出最明确的主要部分。而我国以500万美元的投入,进入五强国历时10年、总投资达又亿美元的hGP行列。这种在关键时刻所表现的远见卓识、决策的果断与经费到位的快速,都是前所未有的。
2.改变了国际人类基因组研究的格局,提高了人类基因国际合作的形象,受到了国际同行,特别是参与“人类基因组计划”的各个中心以及发展中国家的欢迎和称颂。
国际合作、公众支持的“人类基因组计划”已历时10年,一直受到美国私人公司的挑战。国际“人类基因组计划”负责人一直希望提高国际合作的形象,而由于‘人类基因组计划”投入巨大、技术复杂,使英、美、日、德、法之外的其他国家,望而却步,采取了“你成我拿,你干我看”的观望态度。多数国家,特别是发展中国家,一方面基于hGP对人类本身的认识与生物产业发展之攸关,在道义上力争共享人类基因组序列信息的权利;一方面由于不能直接参与而没有实际的发言权。
正在这个时候,中国的参与,无疑受到国际“人类基因组计划”团体与发展中国家的一致欢迎。真正参与并分担实际任务的其他15个中心的负责人,无不致电致信表示欢迎,至诚之心溢于言表。
在联合国教科文组织“国际生物伦理委员会’第六次会议上,我国委员,本书(指《生命大解密》)作者之一的杨焕明先生,作为发展中国家惟一真正参与“人类基因组计划”的代表,深感地位的改变:国际“人类基因组计划”负责人,希望我国代表多为hGP精神呼吁;发展中国家又希望我国能在“人类基因组计划”中多为他们争取权益。
“人类基因组计划”接近完成,各个国家讨论“人类基因组计划”的层次已达到国家最高领导人,我们这一地位将更加令人注目。
3.“1%项目”,使我国理所当然地分享“人类基因组计划”的全部成果与数据、资源与技术,拥有有关事务的发言权。
国际“人类基因组计划”的宗旨是全球合作的跨国项目。不参与,就不能直接获得资源与技术;不参与,就不可能有发言权;不参与,就随时有失去分享数据的危险。
北京中心数次派人员直接到美国最大、自动化程度最高、生物信息学最为先进的中心参观学习。所到之处,无不受到主要负责人亲自接待,具体介绍5一6个小时,并帮助培训掌握最核心的技术。我们测序的所有BAC克隆,都来自国际标准化文库,所有的BAC信息都是由他们免费提供的。
国际“人类基因组计划”所受到的挑战,带来了我国在“人类基因组计划”有无发言权的问题。如这次与美国私人公司“赛里拉”的谈判,事关世界各国能否继续分享人类基因组序列信息的大局。国际人类基因组中心的负责人向我们通报了情况并诚言:我们向您许诺,没有经过您参加的会议的七寸论,我们不会做出任何决定。如果没有“丑项卧’,这种情况是不可想象的。
4.建立了我国自己的、接近世界水平的基因组研究实力。
通过参与而分享了国际人类基因组的资源与技术,我国在短短的6个月内,走过了别人积累10年的历程,缩短了可直接比较的差距。中国科学院遗传研究所人类基因组中心日产数据ZMb,相当于世界上最强的两个中心在1993年的年产量。我们已建立了一支训练有素的能打硬仗的队伍,建立了有自己特点的全套系列与技术,积累了世界级大规模中心的运作管理经验,奠定了进一步发展的坚实基础。
我国信息产业的上游——软件与硬件,已受制于人,我们民族已在为此付出代价。
资源基因已成为一个国家发展的战略资源。争夺这一资源的“世界大战”已经打响。
2000年1月13日,企图垄断基因组信息的赛里拉公司宣布:在中国的台湾与上海同时登陆。在台湾,他们得到了政界首要的支援,计划投资一亿美元。在上海,他们收购了原先以。‘“测序服务”注册的外资公司Gewt的95%的股份。赛里拉公司的头头公开声称:得到中国富甲天下的动物、植物与人类的遗传的多样性资源,是赛里拉公司扩大国际商务与基因组信息的基础。无疑,赛里拉公司此举是有“远见”的:一方面,以掌握了中国丰富的生物资源为宣传,直逼坚持“平等分享”原则的国际“人类基因组计划”;另一方面,以雄厚的资本:一期投资3亿美元,现股票市场估价为80亿美元,与强大的技术实力:拥有300台毛细管测序仪,号称“天下第三”的超大型计算机,妄图实际控制中国的生物资源的梦想。
中国的信息产业已失“源头”又缺实力,正在走以市场换技术求发展的路子,我国的生物产业,再也不能重蹈“以资源换技术”的覆辙。
通过“1%项目”,我们已完全具备与赛里拉等公司,在速度与成本上的竞争能力。
“1%项目”已成为对付“赛里拉”掠取我国生物资源的桥头堡。
建立我国的基因组测序的强大实力,与“赛里拉”等公司抗争,是保护、发展、利用我国丰富的生物资源的重要前提。由于参与了“人类基因组计划”,随着“1%项目”
的完成,我们与“赛里拉”的抗争,不但不会影响我国的开放形象,相反,会进一步增进国际同行的理解与信任。
“1%”为21世纪的中国生物产业带来了光明和希望;历史将证明“1%”在中国科技史上的意义。(见杨焕明等着《生命大解密》)
一功能基因组学
当前,随着结构基因组学向染色体完成序列图的目标顺利进展,以揭示基因组的功能及调控机制为目标的功能基因组学已提上议事日程。美国hGP(人类基因组计划)1998一2003年的新目标,除了完成基因组全序列测定之外,还有人类DNA序列变异,全长d3NA克隆、发展全基因组水平功能分析的技术、模式生物体等属于功能基因组学范畴的内容。一般认为功能基因组研究包括的核心科学问题有:基因组的多样性;基因组的表达及其时、空调节;模式生物基因组研究等。还应指出,生物信息学也是对功能基因组学数据进行储存、分析和发掘的基本手段。
1.基因组多样性的研究
人类是一个具有多态性的群体。不同群体和个体在生物学性状以及在对疾病的易感性航性上的差别,反映了进化过程中基因组与内、外环境相互作用的结果。开展人类基因组多样性的系统研究、无论对于了解人类的起源、进化和迁徙,还是对于生物医学均会产生重大的影响。已知人类基因组DNA序列中最常见的变异形式是SNP,在全基因组中估计有3—10X10个。与罕见的单碱基变异所不同的是,SNP等位位点的频率应等于或高于1%。当SNP位于基因的编码序列中即称为cSNP。若CSNP引起蛋白质重要部位氨基酸的变异,可导致其功能改变;位于基因调控序列中的SNP则可能影响基因表达的剂量。故这两种SNP的生物学意义更为显着,是基因组中决定人类表型多样性的核心信息。另一方面,SNP因连锁不平衡(LD)所形成的单倍型,也可用于关联研究来确定与之连锁的生物学性状相关序列。目前,已发展了多种自动化和批量化检测SNP的技术,其应用范围十分广泛,包括连锁分析与基因定位;疾病的关联研究;多基因疾病的基因定位;个体识别和亲子鉴定,发病机理的研究;以及研究生物进化,生物间相互关系等。前曾述及,edera的人类基因组测序计划包括了SNP。针对此种情况,1999年国际上10家大药厂与三家研究机构建立了SNP协作组,以后又吸引信息技术产业的数家大公司参与,对24个来自世界不同群体的个体,进行SN’P的随机筛选,计划到2001年获得30万个SNP,其中半数得到定位,从而将整个基因组分隔为5-50Kb长度的LD片段。目前,该计划进展顺利,所发现的SNP在人群中测试的成功率为94%,已有41,200个SNP向公共领域公布。
值得指出,目前已发现的大多数SNP属于全球人群中随机频率较高的变异,因而也就是人类进化早期阶段(约如一20万年前“走出非洲”的时刻)的“老”的SNP(约占全部SNP的85%),这些SNP的to程度较低。已知不同人群间的SNP频率可以有相当大的差别,某些SNP甚而呈现群体专一性(两者相加约占全部SNP的15%),选择这些更为“年轻”的、具有群体特异性的SNP,可能更适合基于LD的关联分析。
在基因组多样性研究方面,一个近年备受医学界和制药工业界关注的新领域是药物基因组学(Phmmpcs)。药物的疗效和副作用受到机体多种因素的影响,尤其是药物代谢酶、转运体、受体和其他药物靶点蛋白,而编码这些蛋白的基因在不同个体间又存在着遗传多态性,其基本形式也是SNPo药物基因组学就是要阐明个体间在药物代谢和效应方面发生差别的遗传基础,促进新药的发现,并根据个体的遗传背景来优化药物治疗方案,亦即“个体化治疗”。这一研究同时也能使某些药物找到合适的治疗人群。
2.基因组的表达调控和蛋白产物的功能
基因转录表达港及其调控的研究
一个细胞的转录表达水平能够精确而特异地反映其类型、发育阶段以及反应状态,是功能基因组学的主要研究内容之一。为了能够全面而不是孤立地评价全部基因的表达,需要建立全新的工具系统,其定量敏感度应达到1个拷贝/细胞,定性敏感度应能够区分剪接方式,还须达到检测单个细胞的能力。近年来发展的DNA芯片以及微量RNA探针制备技术已基本达到了这些目标。目前,应用DNA芯片或(::ury微阵列技术检测基因组表达谱的主要瓶颈,已经是如何设计新的软件和算法,对生物芯片所产生的大量信息在生化通路和调控网络的水平进行分析和整合。
蛋白质表达及其功能的大规模研究(蛋白质组学,Pro-t——i。)蛋白质组学研究的定义是在生命体或细胞的整体水平研究蛋白质的表达和修饰状态。
目前一般使用的技术路线,是提取细胞的蛋白质,利用标准化的双向凝胶电泳分离后,用质谱仪对各个蛋白点进行分析,根据多肽的特征分析并与蛋白质数据库进行比较,鉴别蛋白质的类型和检测其修饰状态(如磷酸化和糖基化)。为此,已发展了一些新的仪器系统如MALto-’t(时间飞行质谱)或,feet]"iC8pny(电子喷射)。此外,也有人在设计和制作各种蛋白生物芯片。蛋白质组的另外一个重要工作内容是建立蛋白质相互作用的系统目录,目前较常用的手段是格式化、规模化的酵母双杂交体系。
3模式生物体作为功能基因组学工具
比较基因组研究
如前所述,在人类基因组的研究中,模式生物体的研究占有极其重要的地位。模式生物体的基因组结构相对简单,但是它们的核心细胞过程和生化通路在很大程度上是保守的。通过比较和鉴别进化不同阶段生物体的基因组信息,将进一步加深对人类基因组结构和功能的了解。如表是所承,从整体上看,随着进化程度的从低到高,即从原核生物到真核生物、单细胞生物到多细胞生物、节肢动物到哺乳类,基因组的信息含量由小到大,基因数量由少到多,平均基因长度由IKb到30Kbo其中,基因的平均长度可能是基因组功能复杂度最重要的指标。例如,线虫作为仅三,000个细胞的动物,有约18,000个基因,而果蝇的细胞数要多十倍以上,却只有13,600个基因,仅从基因数目上看很难理解这种“倒置”现象,但是,按每个基因的平均长度,则线虫为5.3Kb,而果蝇为10Kb。
功能缺失突变和转基因的研究
识别基因功能最有效的方法可能是观察基因表达被阻断后在细胞和整体所产生的表型变化。在这方面,基因剔除术(t)模式生物体成为特别有用的工具。目前,国际上已实现了对酵母所有基因的缺失突变体构建。随着线虫和果蝇基因组测序的完成,也可对这两种生物展开类似的研究。小鼠作为哺乳类中代表性的模式生物,在功能基因组学研究中占有特殊的地位。到2000年3月17日为止,已产生的小鼠基因剔除或其它突变模型已达到2,282种。近年来发展的条件化基因剔除术,已可达到对任何基因在不同发育阶段和不同器官、组织的选择性剔除。除了用同源重组技术制造基因剔除生物,也可用化学诱变剂或插入突变方法随机诱导模式生物体的基因突变,对产生表型变化者利用快速基因定位法识别致病基因。例如,德国科学家率先应用突变诱导剂ENU对斑马鱼和小鼠胚胎干细胞(ES细胞)进行大规模随机致突变和表型筛查,取得了很大成功。德国还建立了在小鼠巴细胞水平进行随机插入突变的合作网络。此外,近来也有人利用组合化学方法尝试针对蛋白质的化学“剔除”试剂,用来激活或失活各种蛋白质。
上述的功能缺失突变分析手段固然十分重要,但也存在着若干限制因素。如许多基因在剔除后并未产生明显的表型改变,可能是这些基因的功能为别的基因所代偿。因此,在模式生物引入基因的高表达,观察对调控网络的影响,也是研究基因功能的重要手段之一。
二疾病的基因组学
是.从“定位克隆”到“定位候选基因”
hGP的直接始动因素是要解决包括肿瘤在内的人类疾病的分子遗传学问题,因此与人类健康密切相关。另一方面,6千多种单基因遗传病和多种大面积危害人群健康的多基因疾病(如肿瘤、心血管病、代谢性疾病、神经一精神类疾病、免疫性疾病等)的致病基因和相关基因,代表了具有一定生物学允余性的所有人类基因中,结构和功能完整性至关重要的那一部分。因此,疾病基因的定位、克隆和鉴定,是hGP各种竞争中居于核心的部分,也是hGP启动以来在社会上显示度最大的成就。
80年代之前,绝大多数人类遗传性疾病的生化基础未知,无法用表型一蛋白质…基因的传统途径进行研究。在hGP的遗传和物理作图带动下,出现了“定位克隆”的全新思路,导致了包括囊性纤维化、享廷顿舞蹈病、遗传性结肠癌、乳腺癌等一大批重要疾病基因的发现,为这些疾病的基因诊断和未来的基因治疗奠定了基础。随着人类基因组序列工作草图的问世,所有人类基因很快就会被精确地定位于染色体的各个区域。因此,一旦某个疾病位点被定位,即可从局部的序列图中进选出结构、功能相关的基因进行分析,这就是“定位候选基因”的策略。
2.多基因病
当前,多基因疾病已成为疾病基因组学研究的重点,多基因疾病木遵循孟德尔遗传表型一基因型的规律,难以用一般的家系遗传连锁分析取得突破。过去数年中,已发展了受累同胞对分析、关联研究和连锁不平衡(LD)分析、基于家系背景的连锁不平衡分析(尤其是家系传递巧变锁不平衡分析,transmission/disapilibriumtesst,tDt)等多种方法,结合MS和SNP等高度多态性标志的应用,对家系和人群进行疾病相关位点在基因组中的定位。一般认为,隔离人群或较均一的人群可能是进行多基因性状定位研究较理想的群体,已知多基因疾病是由多个微效基因的累加作用和某些环境因子作用所致,估计参与多基因疾病发病原理的基因可达3-20个,这些基因的SNP及其特定组合可能是造成疾病易感性最重要的原因。因此,选择相对隔离人群,对疾病相关调节通路的候选基因或通过基因组定位所限定的候选基因进行SNP的关联研究,可能是多基因疾病发病原理取得突破的希望所在。
3.疾病相关基因的网络概念
从生物大分子互作和网络调控的结构模式来研究和分析疾病基因的作用,是当前疾病基因组学研究的另一个特点。即使是在单基因疾病,基本的分子发病学原理也是由于疾病基因蛋白产物结构一功能的缺损或改变,阻碍或干扰了在特定生化通路中的生物大分子相互作用;而多基因疾病发生和发展更是多基因或多通路间平衡失调的结果。这样一种认识突破了以往“一个基因一种清’的模式,既能更深入透彻地了解疾病病理生理过程及其影响因素,又为利用调节网络设计药物或基因治疗提供了新的思路。
4.基因组信息与环境的相互作用
绝大多数人类疾病是基因组信息与环境因子相互作用的结果。1997年美国提出了环境基因组学计划(EGP),其目的是要了解环境对人类疾病的影响和意义。由于人类遗传的多态性,不同个体对环境致病因素的易感性也有差异。针对与环境中物理、化学或生物因素发生相互作用蛋白的编码基因(如DNA修复机制、氧化一还原反应及病毒受体蛋白等),识别其基因组多样性和结构一功能关系,将有助于发现特定环境因子致病的风险人群,并制定相应的预防措施和环境保护策略。(陈竺:人类基因组研究现状及发展》)