美狮彩票

張勇研究組建立靈長類特異新基因數據庫並系統預測新基因功能

  靈長類特異乃至人特異新基因起源是推動人類表型演化的重要推動力,但只有少量新基因功能已知。近年來基因編輯技術和類器官技術的發展使得系統揭示新基因在人之所以爲人這一演化過程中的貢獻成爲可能。然而,由于基因年齡推斷方法的差別以及較低的新基因注釋質量(很難區分新蛋白編碼基因簣D倩因),文獻中已經發表的靈長類特異新基因(PSG)數據集相互之間差別極大。一個相對可靠的PSG數據集的缺乏阻礙了深入的功能研究。

  中國科學院動物研究所张勇课题组通过整合进化基因组和功能基因组数据开发了人类新基因数据库(GenTree, http://gentree.ioz.ac.cn)。GenTree可輔助用戶分析基因何時起源、如何起源以及可能的功能(圖1)。

  基于GenTree數據的整合分析發現:1)以基因組共線性爲基礎的基因年齡推斷方法與其它方法相比對近期起源的基因有較高的准確率;2)蛋白水平的選擇壓力推斷和蛋白基因組方法(proteogenomics)只能注釋部分靈長類特異基因的蛋白編碼能力。本研究考慮了這些方法各自的特點之後鑒定了846PSG(圖2)。其中,254個基因有不同程度的蛋白支持证,该集合也包含了41個错误注释的假基因(如MYH16)。

  基于GenTree中所整合的轉錄組數據,本研究通過共表達分析推測了846PSG的功能。與此前的認識相符,PSG經常呈現睾丸特異或睾丸偏好的表達;但PSG也呈現骨髓或胎盤偏好的表達譜。有意思的是,雖然PSG在成年脑中的表达量较低,但在孕中期胎脑表达上调(圖3)。富集于各共轉錄網絡並占據網絡較核心位置的PSG可能推動了精子發生、免疫反應、母胎互作以及胎腦發育等快速演化的生命過程。

  总体来看,该工作提供了一個专门的人类新基因数据库,产生了相对高质量的PSG列表並推測了這些基因的功能。結果中所展示的年齡推斷方法、基因注釋方法的特點以及新基因器官特異的功能偏好性對研究其它物種種系特異基因的工作具普遍參考意義。

  該研究于2019312日在線發表于 Genome Research doi:10.1101/gr.238733.118)。博士研究生邵毅、陈春燕为共同第一作者,张勇研究員为通讯作者。龙漫远、何斌、沈浩、朱政霖、余大奇、降帅、赵石磊、高志强、付岩、陈希、高歌、陈华等合作者在文章写作、网页开发、数据分析方面提供了大力支持。本研究得到了中國科學院先导专项、國家自然科學基金委員會和科技部的资助;计算需求得到了中國科學院北京基因组研究所基因组测序与数据分析中心和中國科學院動物研究所高性能平台的支持。 

1GenTree網頁界面示例

A) 谷氨酸脫氫酶2 (GLUD2)在人和長臂猿的共同祖先起源;B) GLUD2只编码一個外显子,而其最相似的同源基因GLUD1編碼多外顯子,暗示著GLUD2起源于GLUD1mRNA水平的重複事件(逆轉錄);C) GLUD1廣譜高表達,GLUD2除了睾丸之外,其它器官轉錄水平較低,暗示著後者功能可能比較局限。 

2:靈長類特異基因列表 

灰色箭頭說明蛋白編碼能力可信度的下降,例如85Ensembl注釋的蛋白編碼基因不僅有蛋白表達的證據(UniProt)也有功能研究(GO),而90PSG只有蛋白表達,質譜和選擇壓力中的一種證據。值得一提的是846個灵长类特异基因包含192個人类特异的新基因。 

3:不同腦發育階段共轉錄模塊(橫軸)編碼靈長類特異基因的比例(縱軸) 

PCWMAB分別代表孕周和出生後月份。共轉錄模塊2BM2)與基因組背景(粉紅線標記)相比統計上顯著富集靈長類特異基因。該模塊與其它四模塊(藍色標記)都富集自閉症易感基因,暗示它們的重要性。 

關于我們
聯系我們
地  址:北京市朝陽區北辰西路1號院5號
郵  編:100101
電子郵件:ioz@ioz.ac.cn
電  話:10-64807098
傳  真:10-64807099
友情鏈接