相關導航

Navigate

聯系電話
15375424387

 
您現在所在的位置:首頁 >> 新聞動態 >> 行業資訊
Nature Methods:中山大學中山眼科中心團隊發表三代測序計算方法
2017/10/24 15:54:26 瀏覽次數:390


    9月18日,中山大學中山眼科中心謝志、肖傳樂、謝尚潛,以及中山大學數據科學與計算機學院陳穎和克萊姆森大學羅峰等學者,Nature Methods在線發表了三代基因組測序數據計算方法文章題目為 “MECAT: fast mapping, error correction, de novo assembly tool for single-molecule sequencing reads”。這項合作研究的計算方法解決了該領域的關鍵技術難題。

以PacBio和Oxford Nanopore公司為代表的三代測序技術能夠產生遠遠長于二代測序技術的基因組序列讀長,并且實現在單分子水平進行基因測序,在動植物的基因組組裝、基因組結構變異,DNA修飾檢測、全長轉錄本測序中廣泛應用。然而,三代測序數據高測序錯誤率(12-15%)給三代測序基因組數據分析帶來了巨大的挑戰,尤其在長序列局部序列比對和序列錯誤堿基校正過程中消耗大量的計算時間和資源,嚴重影響了三代測序技術的應用和發展。

針對三代測序基因組分析耗時的問題,項目負責人謝志和主要完成人肖傳樂等研究人員提出了基于全局種子投票打分的候選匹配序列評估方法,該方法可以大幅降低三代測序序列比對,校正和組裝的計算資源消耗,從而大幅提高計算效率;并將上述方法開發完成了三代測序組裝系統MECAT

首先,為了減少局部序列比對的候選區域,MECAT建立了快速測量兩個序列編輯距離的序列差異因子和全局種子投票打分的計算模型。該模型中兩個序列全局種子得分與重疊長度成線性相關的重要特征,使兩序列重疊區域的長度可以通過種子全局得分進行評估。全局種子得分模型不僅能獲得候選局部比對所需要兩序列的準確起始比對位置,同時首次實現非局部序列比對的兩兩序列比對過程,從而大幅節約了三代測序兩兩比對的計算時間。目前,MECAT在人類基因組上的兩兩比對時間比目前主流軟件快17倍。

其次,在三代測序基因組組裝另一耗時的序列校正步驟中,MECAT通過優選一定最高得分的候選匹配序列進行局部序列比對,大幅降低進入局部序列比對過程的候選序列數量,從而大幅提高三代測序序列校正時間。MECAT的序列校正速度是目前軟件的7-8倍。

總的來說,集成三代測序序列比對,校正和組裝為一體的MECAT系統,與目前的三代測序計算軟件比具有明顯的優勢,尤其是人類基因組的組裝速度是同類軟件(Canu和FALCON)17-23倍,首次在單個服務器上實現了人類基因組組裝工作MECAT大幅降低了三代測序計算硬件平臺要求,從而加速了三代測序的發展和應用

MECAT的研究和開發得到了中山大學中山眼科中心五個五計劃以及中山大學精準醫學培育項目的支持。

參考資料:

MECAT: fast mapping, error correction, de novo assembly for single-molecule sequencing reads. doi:10.1038/nmeth.4432

MECAT系統下載地址:

https://github.com/xiaochuanle/MECAT


收縮
  • 電話咨詢

  • 15375424387
五月天丁香婷深爱综合_无图 亚洲 欧美 偷拍