隨著高精度長讀長測序技術的出現,基因組難以組裝的狀態正在改變。《Nature Methods》雜志上近日發表了一篇文章,介紹了基因組組裝項目如何受益于這種技術。
自測序技術問世以來,利用DNA序列的片段來組裝人類、動植物或微生物的基因組就一直是難題。許多參考基因組都存在缺陷,如組裝錯誤或存在缺口。人類參考基因組GRCh38就有數百個缺口,缺失了大約150 Mb的序列。
隨著高精度長讀長測序技術的出現,這種狀態正在改變。《Nature Methods》雜志上近日發表了一篇題為“Long road to long-read assembly”的文章,介紹了基因組組裝項目如何受益于這種技術。
01左中括號填補缺口左中括
文章作者Vivien Marx指出,填補基因組上的缺口可以幫助人們比較基因組之間的差異。這些方法不僅適用于人類基因組,也適用于其他生物,比如微生物和脊椎動物。去年,“端粒到端粒聯盟(T2T)”成員公布了激動人心的新進展。他們利用CHM13hTERT細胞系,組裝了X染色體和8號染色體的完整序列。
CHM13細胞來源于葡萄胎,具有單倍體人類基因組。聯盟負責人之一Adam Phillippy表示:“當我們只需要組裝一個基因組而不是兩個基因組時,問題就大大簡化了。”如今,他們已經幾乎完成了整個CHM13基因組的組裝,只剩下五個缺口。下一步打算完成二倍體人類基因組的從端粒到端粒組裝。“從單倍體到二倍體,聽起來并不困難,但實際上要復雜得多,”他說。
02左中括號對付著絲粒左中括號
著絲粒一直是極具挑戰性的區域。在X染色體上,著絲粒的基本重復單元的長度為171 bp,而其串聯重復序列正是12個單元的組合,長度約為2 kb。因為不容易克隆,這些衛星DNA的序列很難獲得。T2T聯盟另一名負責人Karen Miga表示,一些新的測序技術可以幫助他們實現目標,比如Oxford Nanopore和Pacific Biosciences。
測序之后還需要組裝。將著絲粒及其重復序列組裝起來,有點像在玩一塊藍天的拼圖,簡直讓人無從下手。丹納法伯癌癥研究所Heng Li實驗室開發出了基因組組裝工具hifiasm,能夠對付著絲粒。同時,加州大學圣地亞哥分校的Pavel Pevzner實驗室最近也開發出了組裝著絲粒的算法centroFlye。他表示,centroFlye是“通過在藍天中尋找一小片白云來進行組裝”。
03左中括號長長長讀長左中括號
Pacific Biosciences和Oxford Nanopore都推出了長讀長測序技術,讀長超過了10 kb。以往的數據顯示,這些技術很容易出錯,但Phillippy認為,現在的情況已經大不相同。PacBio在2019年推出了基于環狀共有序列(CCS)的測序模式,生成了高度準確的HiFi reads。他表示,這種技術在檢測單個分子上的準確性高達99.9%。同時,與五年前相比,納米孔測序的準確度也大大提高。
Pevzner認為,這兩種技術都可以達到90%以上的準確度。“HiFi reads的錯誤率是每一千個核苷酸有幾個錯誤。納米孔的超長測序雖然沒那么準確,但成本也較低。這種情況正在動態變化。”生物學家目前主要使用短讀長技術,但他認為完整組裝的未來屬于長讀長。
04左中括號組裝工具左中括
文章也提到了一些常用的組裝工具,如Falcon、Canu、wtdbg2等。不過在HiFi reads出現后,人們則主要采用HiCanu和hifiasm工具來進行基因組組裝。此外,PacBio的IPA也是專為HiFi reads而優化的組裝工具。
hifiasm的開發者Heng Li也是T2T聯盟的成員之一。他認為,準確的長讀長技術正在幫助人們解析單倍型。“沒多少人意識到我們今天產生的hifiasm/HiCanu組裝的質量比一年前高多了,簡直就是白天和黑夜的區別。”他表示:“組裝領域的目標是實現二倍體樣本的從端粒到端粒組裝,然后是多倍體基因組和宏基因組,它們更難組裝。”
05左中括號泛基因組和宏基因組左中括
如今,人們已經不再滿足于個人基因組研究,而是轉向了人類泛基因組(pangenome)研究,即人類群體基因序列的總和。研究人員認為,高度精確的從端粒到端粒組裝可更好地了解人類的多樣性以及對當地環境的適應。最近涌現出的許多軟件工具可幫助人們從組裝結果中找到基因組差異。
對于宏基因組分析,研究人員往往將Illumina短片段與Oxford Nanopore長片段結合起來,并采用metaSPAdes和metaFlye等工具進行組裝。利用這種方法,人們發現的細菌和古細菌數量增加了一倍以上,且數據表現出更大的系統發育多樣性。
總的來說,作者認為,高精度的長讀長測序正在大大促進基因組組裝項目。
——本文轉載自“理財周刊——財事匯”近日,華大智造(688114.SH)發布2024年度業績快報,數據顯示,公司全年實現營業收入32.10億元,同比增長10.28%;歸屬于母公司所有者的凈利潤虧損5.......
為指導二代基因測序相關體外診斷試劑管理屬性和管理類別判定,根據《醫療器械監督管理條例》《體外診斷試劑注冊與備案管理辦法》《體外診斷試劑分類規則》《體外診斷試劑分類目錄》等,國家藥監局綜合司組織起草了《......
引言:一場技術與貿易交織的攻防戰2025年3月4日,中國商務部宣布將美國基因測序巨頭因美納(Illumina,Inc.)列入“不可靠實體清單”,禁止其向中國出口基因測序儀。這一措施不僅是對美國單邊關稅......
財聯社3月2日訊(記者鄭炳巽)在因美納公司(Illumina,Inc.)受制裁事件之后,國內基因測序行業......
2025年2月20日,在IND2025第五屆感染疾病診斷技術及檢測自動化建設論壇上,思昆生物正式發布新一代桌面式小通量測序儀SikunRapidGS480(以下簡稱“GS480)和AISPre3200......
2024年即將結束,中國基因測序行業的概括,可以說是先抑后揚。生物安全法案的困擾、國內需求疲軟的擔憂……一系列的外因,讓資本市場對中國基因測序行業的未來充滿分歧。當然,分歧歸分歧,行業的基本面并沒有外......
“就像研究天文學需要望遠鏡,研究生物學需要顯微鏡,研究基因需要用到基因測序儀。”華大集團國際發展事務副總裁熊韜近日接受21世紀經濟報道記者專訪時表示。今年11月,以“鏈接世界共創未來”為主題的第二屆鏈......
10月15日,真邁生物南京公司啟用揭牌儀式暨新品發布會在新區生物醫藥谷舉行。中國科學院院士陳潤生,市委常委、江北新區黨工委書記陸衛東,江蘇省藥品監督管理局副局長陳和平,南京市科學技術局局長趙成軍,江北......
世界上有這樣一群人,他們不愿對視、不愛交流、不作回應,仿佛遙遠夜空中的星星,沉浸在自己的世界里。他們是孤獨癥譜系障礙(以下簡稱孤獨癥)兒童,也被形象地稱作“星星的孩子”。近年來,孤獨癥進入大眾視野,但......
近日,中國科學院長春光學精密機械與物理所研究員吳一輝團隊聯合深海科學與工程研究所研究員杜夢然團隊研制的深海生物基因測序儀海試成功。6月3日至9日,深海生物基因測序儀參加“探索二號”TS2-38-1航次......