药最网
首页

基因界“琅琊榜”:1960s至今最热门的基因是它们!

独具药眼

新浪医药专栏作者丨涓涓细流,汇聚沧海;星星之火,终至燎原。聆听医药行业的风吹草动,瞭望医药健康的百世航程。


    


申请成为专栏作者,或原创投稿

请联系:editor@med.sina.com


多年来,美国国家医学图书馆旗下著名的PubMed数据库,对每一篇收录的论文都进行了系统的标记,其中就包含了基因信息。Peter Kerpedjiev,一名从事生物信息学的软件工程师,目前正攻读博士学位。Peter Kerpedjiev借助PubMed数据库,提取了其中所有描述基因结构、功能、位置或其编码蛋白质的文章,分门别类进行整理与统计。


日前,他与《Nature》杂志联合推出了一份基因榜单,这份榜单可谓“星光熠熠”,那些曾在生物遗传学发展历程中“大放异彩”的基因们悉数上榜。这为我们观察遗传学研究提供了一个新的视角。


1

基因热度排名Top10


PubMed数据库收集并整理了自1960s以来的包含基因信息的文章,以此为基础,Peter Kerpedjiev统计了历年来每个基因所相关的文章数目,通过文章数目的大小进行排名。当然,这种只依靠文献数目所进行的基因热度排名存在其片面性,但考虑到PubMed数据库在生物医药领域的全面、专业及其权威性,基于文献数目的排名至少能从某些方面反映出遗传学研究领域的一些现象,其榜单前十名如图1所示。

图1  长期以来与基因相关的文献数目统计Top10(PubMed数据库)


排在首位的TP53的基因,它编码的蛋白质,即p53。目前,它涉及的文献接近8500篇之多,这一数字还在继续增长,平均每天有两篇关于TP53的新研究结果被发表。


对大多数生物学研究者来说,TP53理所当然地成为基因界的“明星”。该基因编码一种肿瘤抑制因子( a tumour suppressor),被形象地称为“基因组的守护神(guardian of the genome)”。它在大约一半的人类癌症中发生了突变。在人类努力攻克癌症的今天,有关TP53的研究被寄予厚望。


在上榜的前十位热门基因中,它们大都与肿瘤、免疫性疾病、心血管疾病等相关,其中跟肿瘤相关的基因占了一半以上。这些疾病都是人类当前亟待解决的健康难题,榜单揭示了这些问题的研究早已进入了分子遗传学的范畴。如表1所示。


表1  热门基因的一些简单介绍


2

潮 流 变 迁


图2  不同历史时期最受研究者关注的“热门”基因


时尚会随着时间变迁,基因的研究热度也是如此。这和当时的研究水平、社会需求以及经济发展水平相关,这些“热门”基因都曾“名噪一时”,如图2所示。


上世纪四五十年代倡导对疾病进行分子水平的研究。突变的血红蛋白基因编码异常血红蛋白,进而导致镰状细胞病,β血红蛋白基因(Haemoglobin subunit beta, HBB)很快进入研究者的视野,1985年前后,在与基因的文献中,HBB占比一度达到10%。在当时研究者看来,HBB比其他任何基因都更关键,它是理解和治疗分子疾病的一个绝佳“突破口”。


但是,随着研究人员获得了用于测序和操控DNA的新技术,他们开始转向其他基因和疾病,包括当时一种“神秘的”感染性疾病——AIDS。HIV有选择性地感染和摧毁T细胞,研究发现,借助T细胞表面上一种表面蛋白——CD4,HIV才得以进入T细胞内。AIDS爆发大规模流行性,引起了世界各地紧急卫生公关。此后三年,CD4基因是生物医学文献中热度最高的基因。据统计,1987-1996年间,CD4出现的频次是NLM统计的所有基因的1-2%。


此外,针对CD4的研究也加速了免疫学的进步,1986年,研究人员意识到,表达CD4的T细胞可以细分为两种不同的群体——其中一种可以消灭感染细胞的细菌和病毒,另一种可以抵御蠕虫等寄生虫的侵袭,这种寄生虫可以在不入侵细胞的情况下引发疾病。


上世纪90年代初,一个不太为人所熟知的名为GRB2的基因开始走入基因研究舞台的中央。1992年,来自康涅狄格州纽黑文的耶鲁大学医学院的生物化学家Joseph Schlessinger,揭示了由GRB2编码的蛋白,即生长因子受体结合蛋白2。GRB2是一个信息传递中继站,它包含一个SH2模块,以及两个激活蛋白质参与细胞生长和生存的域。在上世纪90年代末的三年时间内,它是被引用频次最高的基因。其他研究人员很快介入进来,开启了信号传导领域的研究,陆续发现其他许多细胞信号的传导模块——最终导致癌症、自身免疫疾病、糖尿病和心脏病的治疗。


很快,GRB2的研究“热度”就直线下跌,因为它不是疾病的直接诱因,也不是药物的靶标,其临床应用前景不被看好,这也许注定了GRB2只是“昙花一现”。


起初,癌症研究学界误把TP53认为是一种致癌基因,认为这种致癌基因在突变时,会促进癌症的进展。直到1989年,来自Vogelstein实验室的研究生Suzanne Baker,揭示了TP53实际上是一种肿瘤抑制基因。研究发现,在几乎一半的癌症病例中发生了TP53的突变。如今,TP53成为了基因界的“大明星”。


对癌症的研究促进了TNF基因的发现,它占据着热门基因排行榜的第二位,在NLM的数据中有超过5300次的引用。它编码一种蛋白质——因为够杀死癌细胞,于1975年被命名肿瘤坏死因子(Tumour necrosis factor)。但事实证明,TNF主要是是炎症反应的调控者,它对肿瘤的影响是次要的。目前,抗TNF疗法是治疗风湿性关节炎等炎症性疾病的主要手段,全球范围内每年的销售额高达数百亿美元。


上世纪七十年代中期,研究者发现APOE蛋白能够清除血液中的胆固醇与脂蛋白,自此,APOE蛋白作为预防心脏病的一种降脂治疗被寄予厚望,直到他汀类药物的出现。汀类药物作为降脂药疗效显著,APOE蛋白作为降脂药的开发被迫中止。但又有研究表明,APOE4基因能增加患老年痴呆症的风险。加之基于β-淀粉样蛋白假说的药物研发屡屡失利,APOE基因才再一次“勾起”研究者的兴趣。


3

结  语


基因“热度”排行榜从一个侧面勾勒出生物遗传学发展现状。这么多年来,“明星”基因你方唱罢我登场,增加了人们对于生命的认识维度,促使疾病诊疗进入分子化水平,同时也为“精准医疗”开辟了道路。人类基因组存在大约2万个编码蛋白的基因,还有更多非编码蛋白的基因。目前人类对于基因的认识不过“冰山一角”,那千千万万个未知的“冷门”基因等待着人们去拓荒进取。


责编:Holly

相 关 推 荐

▷ “仿制药指导目录” 对罕见病的宣战?

▷ 2017年中国1类新药临床研究进展

▷ 2018年医疗行业将面临的十大挑战及应对措施


“荣曜2017·新浪医药年度总评榜”报名通道已开启,符合参评标准企业和个人点击公众号菜单栏“荣曜2017”报名吧!

相关话题

相关话题

}