冠狀病毒主要引起呼吸道和胃腸道感染,并且在遺傳學上被分為四個主要的病毒屬:甲型冠狀病毒(Alphacoronavirus)、乙型冠狀病毒(Betacoronavirus)、丙型冠狀病毒(Gammacoronavirus)和丁型冠狀病毒(Deltacoronavirus)。前兩個屬主要感染哺乳動物,而后兩個屬主要感染鳥類。
人們先前已鑒定六種人類冠狀病毒,包括HCoV-NL63和HCoV-229E,它們屬于甲型冠狀病毒;HCoV-OC43、HCoV-HKU1、重癥急性呼吸綜合征(SARS)冠狀病毒(SARS-CoV)和中東呼吸綜合征(MERS)冠狀病毒(MERS-CoV),屬于乙型冠狀病毒。直到2003年SARS大流行、2012年MERS疫情和近期的2019-nCoV疫情發生后,冠狀病毒才引起全球關注。SARS-CoV和MERS-CoV被認為是高致病性的,而且SARS-CoV和MERS-CoV可能由蝙蝠傳播給果子貍或單峰駝,最后傳播給人類。
冠狀病毒的基因組大小在26000至32000個堿基之間,包括可變數量(6至11個)的開放閱讀框(ORF)。第一個ORF大約占整個基因組的67%,編碼16種非結構蛋白(non-structural protein, nsp),剩下的ORF編碼輔助蛋白和結構蛋白。四種主要的結構蛋白是刺突表面糖蛋白(S)、小包膜蛋白(E)、基質蛋白(M)和核衣殼蛋白(N)。S蛋白在結合到宿主細胞表面上的受體中起著至關重要的作用,并且決定著宿主趨向性。
SARS-CoV的S蛋白和MERS-CoV的S蛋白通過不同的受體結合結構域(RBD)與不同的宿主受體結合。SARS-CoV使用血管緊張素轉換酶2(ACE2)作為主要受體之一,并使用CD209L作為替代受體,而MERS-CoV使用二肽基肽酶4(DPP4,也稱為CD26)作為主要受體。初步分析提示著2019-nCoV與蝙蝠SARS樣冠狀病毒(SARS-like CoV)具有密切的進化關聯性。
在一項新的研究中,來自中國醫學科學院北京協和醫學院、中國疾病預防控制中心病毒病預防控制所、中南大學、蘇州大學和湖南大學的研究人員根據新冠狀病毒2019-nCoV---的前三個已確定的基因組,即Wuhan/IVDC-HB-01/2019(GISAID登錄號:EPI_ISL_402119)(HB01),Wuhan/IVDC-HB-04/2019( EPI_ISL_402120)(HB04)和Wuhan/IVDC-HB-05/2019(EPI_ISL_402121)(HB05),對這種病毒進行了深入的基因組注釋,并與相關冠狀病毒進行了比較,這些相關冠狀病毒包括1008個人SARS-CoV,338個蝙蝠SARS-like CoV和3131個人MERS-CoV,它們的基因組在2020年1月12日(發布日期:2019年9月12日)之前已在病毒病原體數據庫(Virus Pathogen Database)、分析資源(Analysis Resource, ViPR)(http://www.viprbrc.org)和美國國家生物技術信息中心(NCBI)上發表。
相關研究結果于2020年2月7日在線發表在Cell Host & Microbe期刊上,論文標題為“Genome Composition and Divergence of the Novel Coronavirus (2019-nCoV) Originating in China”。
對這三種2019-nCoV毒株的基因組序列進行比較顯示它們幾乎是一樣的,在大約29.8 kb的基因組中僅有5個核苷酸不同。對2019-nCoV基因組進行注釋后發現它有14個ORF,編碼27種蛋白(圖1A)。位于這種基因組5'末端的orf1ab和orf1a基因分別編碼pp1ab和pp1a蛋白。這兩種蛋白總共包含15種nsp,具體為nsp1至nsp10和nsp12至nsp16(圖1A)。這種基因組的3'端包含四種結構蛋白(S、E、M和N)和八種輔助蛋白(3a、3b、p6、7a、7b、8b、9b和orf14)。
在氨基酸水平上,2019-nCoV與SARS-CoV非常相似,但也有一些顯著差異。比如,8a蛋白存在于SARS-CoV中,而在2019-nCoV中不存在;8b蛋白在SARS-CoV中為84個氨基酸,但在2019-nCoV中則較長,為121個氨基酸;3b蛋白在SARS-CoV中為154個氨基酸,但在2019-nCoV中則較短,只有22個氨基酸。還需開展進一步的研究來闡明這些差異如何影響2019-nCoV的功能和發病機理。

圖1.2019-nCoV的基因組組成和系統進化樹,圖片來自Cell Host & Microbe, 2020, doi:10.1016/j.chom.2020.02.001。
正如利用分子進化遺傳學分析(MEGA)(版本7.0)構建出的基于全基因組的系統進化樹(圖1B和S2)所顯示的那樣,2019-nCoV與MERS-CoV、蝙蝠SARS-like CoV和SARS-CoV處于相同的乙型冠狀病毒進化枝中。這種系統進化樹分為兩個進化枝。
乙型冠狀病毒屬構成一個進化枝,而甲型冠狀病毒、丙型冠狀病毒和丁型冠狀病毒屬構成另一個進化枝。2019-nCoV與蝙蝠SARS-like CoV平行進化,而SARS-CoV由蝙蝠SARS-like CoV進化而來,這表明就全基因組序列而言,相比于SARS-CoV,2019-nCoV與蝙蝠SARS-like CoV存在更密切的親緣關系。
相關數據還顯示2019-nCoV的基因組與蝙蝠SARS-like CoV(MG772933)的基因組具有最高相似性。相比之下,2019-nCoV與MERS-CoV的進化距離較遠,親緣關系也不密切。針對pp1ab、pp1a、E、M、7a和N基因的編碼蛋白的系統進化樹分析顯示2019-nCoV最接近于蝙蝠SARS-like CoV(圖1C)。
就S基因而言,2019-nCoV最接近于蝙蝠冠狀病毒,而它的3a和8b基因都最接近于SARS-CoV。盡管不論是在整個基因組上還是在單個基因上的系統進化樹分析都明確表明,2019-nCoV與蝙蝠SARS-like CoV存在最密切的親緣關系(圖1B和1C),但是這些研究人員沒有發現單個蝙蝠SARS-like CoV毒株含有的所有蛋白都與2019-nCoV最為相似(圖1B和1C)。
鑒于2019-nCoV與SARS-CoV或蝙蝠SARS-like CoV之間存在密切的親緣關系(圖1B和1C),對不同蛋白中氨基酸替換的研究可能能夠揭示2019-nCoV在結構和功能上與SARS-CoV有何不同。在2019-nCoV(HB01)的氨基酸序列與SARS-CoV和蝙蝠SARS-like CoV的對應共有序列(consensus sequence)之間共有380個氨基酸替換(圖2)。在nsp7蛋白、nsp13蛋白、E蛋白、M蛋白、輔助蛋白p6和8b中均未發生氨基酸替換。nsp3和nsp2中分別有102個和61個氨基酸替換。
此外,在長1273個氨基酸的S蛋白中發現了27個氨基酸替換,包括RBD中的氨基酸區域357-528有6個氨基酸替換,在基礎亞結構域(SD)中的氨基酸區域569-655有6個氨基酸替換。在受體結合亞基S1結構域的C端(圖2)存在的4個氨基酸替換(Q560L、S570A、F572T和S575A)位于兩個以前被報道為SARS-CoV抗原的肽中。

圖2.2019-nCoV相比于SARS-CoV和SARS-like CoV發生的氨基酸替換,圖片來自Cell Host & Microbe, 2020, doi:10.1016/j.chom.2020.02.001。
由于對這種新型病毒的了解非常有限,這些研究人員無法對2019-nCoV與SARS-CoV或SARS-like CoV之間存在的大量氨基酸替換給出合理的解釋。比如,2019-nCoV和SARS-CoV中與人受體ACE2蛋白直接相互作用的受體結合基序中不存在氨基酸替換,但在RBD的其他區域發生了六個突變。與SARS-CoV相比,這些差異是否會影響2019-nCoV的宿主趨向性和傳播特性值得在未來開展進一步的研究。
參考資料:
Aiping Wu et al. Genome Composition and Divergence of the Novel Coronavirus (2019-nCoV) Originating in China. Cell Host & Microbe, 2020, doi:10.1016/j.chom.2020.02.001.
? 在美國人類遺傳學會(ASHG)年會上,因美納5堿基解決方案的早期試用客戶——倫敦健康科學中心研究所將展示該技術在加速罕見病病例解析方面的強大潛力。? 因美納專有的5堿基化學技術......
人類基因組中存在大量具有"跳躍"能力的逆轉座子(retrotransposon)序列。在胚胎發育早期、免疫和神經系統等特定階段和環境下,它們會被激活,發揮重要生理功能;在病毒感染、......
橡膠樹是天然橡膠的主要來源。“橡膠樹育種面臨的主要困難在于周期長和效率低,通過常規育種方法將多抗、高產性狀聚合往往需要30~40年。”中國熱帶農業科學院橡膠研究所研究員程漢告訴《中國科學報》。然而,目......
記者宋喜群、馮帆從山東農業大學獲悉,該校農學院教授孔令讓研究團隊首次組裝了小麥遠緣雜交常用物種中間偃麥草和鵝觀草染色體水平的高質量基因組序列,解析了二者基因組結構差異與獨立多倍化演化路徑,對兩者攜帶的......
近日,中國農業科學院煙草研究所煙草功能基因組創新團隊發現煙草分枝發育“開關基因”,預示著未來作物株型調控有了新靶點。相關研究成果發表在《植物生物技術》(PlantBiotechnologyJourna......
薇甘菊作為全球十大最具危害的惡性入侵雜草之一,以其驚人的繁殖速度和強大的環境適應性,在亞洲、太平洋地區及中國華南地區造成嚴重生態破壞。然而,其基因組層面的適應性進化機制長期未被系統解析,制約了科學防控......
近日,中國科學院大連化學物理研究所研究員周雍進團隊與上海交通大學副教授魯洪中合作,在酵母系統生物學研究中取得新進展。研究團隊通過整合分析全球1807株釀酒酵母菌株的基因組與生態位數據,構建了高覆蓋度的......
近日,中國農業科學院農業基因組研究所農業基因編輯技術創新團隊深入解析了中亞野豬種群在跨越歐亞大陸百萬年的遷徙歷程中適應環境的獨特遺傳密碼,為理解大型哺乳動物如何應對環境變化提供了全新視角。相關研究成果......
人類基因組中超98%的遺傳變異位于非編碼區,這些變異通過調控染色質可及性、三維構象、剪接加工等多種分子機制影響基因表達,最終導致疾病發生。由于調控機制的復雜性和細胞類型特異性,目前解讀非編碼變異的分子......
近日,中國科學院生物物理研究所徐濤研究組和何順民研究組在《基因組、蛋白質組與生物信息學報》雜志發表論文。兩位科學家牽頭的“女媧”中國人群基因組計劃旨在構建中國人群的全基因組數據資源,支撐中國人群的疾病......