首個完整無間隙人類基因組序列出爐 助力破解最后的“黑匣子”
人類的基因組常常被比作生命的“天書”——A、T、G、C四種堿基構成了DNA,卻配對出超過60億種可能,足見其紛繁復雜。
在由中、美、英、法、德、日6國科學家共同參與研究的人類基因組序列草圖正式發布20多年后,國際科學團隊端粒到端粒聯盟(T2T)宣告第一個完整的、無間隙的人類基因組序列問世,這本人類生命“天書”終于完整了。它首次揭示了高度相同的節段重復基因組區域及其在人類基因組中的變異,這是對標準人類參考基因組,即2013年發布的參考基因組序列(GRCh38)的重大升級。
4月1日,《科學》雜志連發6篇論文報道了這一成果。
這一成果將從根本上改變我們治療多種疾病的方式。隨著新冠病毒新變種的頻繁出現,科學家們可以使用完整的基因組測序來尋找與該疾病相關的突變,他們還可以更詳細地利用其來研究人類遺傳變異的進化,或將徹底改變人們理解人類進化的方式。
8%的“空白區”不是“垃圾”
2001年2月12日,國際人類基因組計劃首次公布人類基因組圖譜及初步分析結果;2003年4月15日,人類基因組序列草圖正式公布。然而,由于技術條件限制,當初的人類基因組圖譜留下了大約8%的空白間隙。這一很難被測序的部分,由高度重復的DNA序列組成,包含染色體末端的端粒和染色體中心節點的著絲粒。
著絲粒背后的異染色質序列位于染色體的關鍵部位,在人類基因組序列草圖中,它們都被標記為N的長序列,表示“未知的堿基”。13、14、15、21和22號染色體的短臂序列也同樣被忽略。
美國國立衛生研究院下屬的國家人類基因組研究所(NHGRI)所長、醫學博士埃里克·格林稱,缺少片段的基因組“就像缺少句子的段落”一樣不完整。
華盛頓大學霍華德·休斯醫學研究所研究員埃文·艾希勒說,對DNA進行測序就像解決拼圖游戲一樣。科學家們必須首先將DNA分解成更小的部分,然后使用測序儀以正確的順序將其拼湊在一起。
現在,新的T2T基因組圖譜補足了拼圖盒圖片上8%的空白,并更正了此前拼圖中存在的數千個錯誤。大多數新添加的DNA序列位于重復端粒和著絲粒附近。
新的無間隙版本被稱為T2T—CHM13,由30.55億個堿基對和19969個蛋白質編碼基因組成,增加了近2億個堿基對的新DNA序列,包括99個可能編碼蛋白質的基因和其中近2000個需要進一步研究的候選基因。這些候選基因大多數是失活的,但其中115個仍然可能表達。研究團隊還在人類基因組中發現了大約200萬個額外的變異,其中622個出現在與醫學相關的基因中。此外,新序列還糾正了GRCh38中的數千個結構錯誤,消除了每個樣本中數以萬計的假陽性變異,包括269個與疾病相關的已知或疑似基因的變異。
根據艾希勒的說法,事實證明,許多研究人員認為是“垃圾或無關緊要”的那些重復序列實際上非常重要。
由于之前的GRCh38模型(稱為參考基因組)是多個個體基因組的組合,基本上將一個人的基因組與另一個人的基因組“縫合在一起”,因此存在一些錯誤和重疊。而新的、完整的版本消除了這些縫隙,更能代表一個人的實際基因組的樣子。
助力破解最后的“黑匣子”
由于重復區域的復雜性,剩下的8%的人類基因組多年來一直困擾著科學家。一方面,它包含具有多次重復的DNA區域,這使得使用以前的測序方法以正確的順序將DNA串在一起具有挑戰性。
早期,被稱為“短讀長”的DNA測序技術一次只能讀取相對較短的序列,也就是提供數百個DNA堿基序列。這是20年前唯一可用的基因組圖譜技術。例如,假設基因組的一部分由連續重復9次的句子“只工作不玩耍,聰明孩子也變傻”組成。該技術只會顯示其中的一部分,例如“只工作”“聰明”“孩子也”等。研究人員將這些簡短的部分拼湊在一起,組成了這句話,但他們無法知道它被重復了9次。因此,運用該技術仍然會在組裝的基因組序列中留下部分空白。
對于10000塊拼圖,當它們看起來相似時,很難正確排列小塊的區域,就像對重復DNA的小片段進行測序一樣。但是對于500塊拼圖,正確排列大范圍區域,即較長的DNA片段,要容易得多。因此,“長讀長”技術應運而生。技術的巨大進步使得研究人員能夠對那些難以閱讀的重復序列進行排序。
在過去的10年中,出現了兩種新的DNA測序技術——“長讀長”技術,可在不影響準確性的情況下生成更長的DNA序列讀數,甚至可一次閱讀整個“句子”或“段落”。
牛津納米孔(Nanopore)的DNA測序方法(超長讀長)一次可讀取多達100萬個DNA字母,準確度適中;而太平洋生物科學公司(PacBio HiFi)的DNA測序方法(高保真讀長技術)可讀取約20000個字母,準確度近乎完美。這兩種測序的結合使T2T研究人員能夠避開區域的重復,并確保裝配的基因序列高度準確。
還有一種工具是默芬(Merfin),研究人員用它來清理人類基因組中一些最困難的序列。默芬使準確測試序列成為可能,它可以感測可能不正確的代碼并自動糾正錯誤。因為生成現代序列的技術更加準確,所以默芬僅用于最棘手的情況。例如,現有的技術很難評估像AAA這樣的完全相同的堿基對,而默芬糾正了這種序列錯誤。
換句話說,科學家們曾經以為,重復區域的拼圖有著幾乎一樣的顏色和形狀,比如看起來都像藍天。但現在,更先進的測序技術使科學家們發現,這些重復的碎片圖案實際不僅僅是藍天,還有草地和太陽。
破解生命“天書”最后“黑匣子”的第二個挑戰是尋找僅包含一個基因組的細胞。標準的人類細胞包含兩組DNA,一組是母系DNA,另一組是父系DNA,但T2T團隊使用的是一組被稱為完全性葡萄胎的細胞的DNA,其中僅包含父系DNA的副本。完全性葡萄胎是一種罕見的妊娠并發癥,由來源于胎盤的細胞異常生長引起。
這種方法簡化了基因組,因此科學家只需對一組DNA進行測序,而不是兩組DNA。
基因組學一個關鍵里程碑
新序列補齊了人類基因組最后一塊拼圖,標志著基因組學領域的一個關鍵里程碑。
新序列揭示了關于著絲粒周圍區域的前所未見的細節。這將大大增加人們對染色體的了解,尤其是著絲粒及其作用。因為該區域對于了解人類進化和遺傳多樣性以及對許多疾病的抵抗力或易感性至關重要。
同時,新序列揭示了以前未被發現的節段重復,即在基因組中重復的長DNA片段。在人類基因組中的20000個基因中,大約950個起源于節段重復。這些人類特有的節段重復是新基因的儲存庫,這些基因會在發育中的大腦中驅動更多神經元的形成,并增強額葉皮質突觸的連接性——可能與人類特有的高級思維、推理、邏輯和語言功能有關。
而更準確的5條染色體臂圖譜的呈現,或幫助科學家開辟新的研究方向,有助于回答有關染色體如何正確分離和分裂的基本生物學問題。
“生成真正完整的人類基因組序列代表了一項令人難以置信的科學成就,提供了人類基因藍圖的第一個全面視圖。”格林說,“這些基礎信息將推進許多正在進行的努力,幫助我們了解人類基因組的細節,這反過來又將為人類疾病的基因研究提供支持。”
除了完成組裝拼圖的醫學研究意義之外,它還有助于回答:我們的基因組中包含什么使我們成為了人類?與其他猿類相比,原始基因組中的一些空白基因現在被認為對于幫助人類制造更大的大腦至關重要。著絲粒的變異性也可能為人類祖先如何進化提供新證據。
現在,科學家能夠隨時間變化跟蹤這些新的基因組區域,從而能夠對一代又一代、不同起源的人或物種進行更嚴格的比較。
例如,艾希勒實驗室的研究生哈維·吉塔特對與人類前額葉皮質擴張相關的基因家族TBC1D3的分析顯示,在靈長類動物進化的不同點上發生了反復和獨立的擴張。最近一次發生在約200萬到260萬年前,大概是人屬出現的時候。令人驚訝的是,人類的TBC1D3基因家族在一部分樣本中顯示出顯著的大規模結構變異。
研究人員在其論文中解釋說,不同的人有著截然不同的TBC1D3基因家族的互補和排列方式。對于一個被認為對大腦功能如此重要的基因來說,這是令人意想不到的??茖W家們還發現了LPA基因復雜結構的多樣性,這種脂蛋白基因部分的變異性是血液中血脂水平異常導致心血管疾病的最重要的遺傳風險因素。
研究人員還研究了SMN基因(一種運動神經元基因),其突變與某些神經肌肉疾病有關。對脊髓性肌萎縮區域(5號染色體上最難完成測序的區域之一)進行更好的序列識別,從而有助于確定疾病風險并進一步治療,因為重復基因SMN2是最有效基因療法之一的靶點。
此外,許多疾病與著絲粒中的結構重復有關,因此,新序列有助于科學家研究與基因相關的疾病。
眾所周知,著絲粒在細胞繁殖時在DNA復制中發揮作用,如果顯著改變它們在染色體中的位置,就可以產生全新的物種。當某些異染色質著絲?;蜻^度表達時,癌細胞會瘋狂分裂;細胞分裂和細胞之間遺傳物質分配出錯也可能導致產前發育的異常,如唐氏綜合癥或羅伯遜易位,而對著絲?;蚪M的全面了解可能為治療這些疾病打開新大門。
基于這些和其他發現,科學家們指出,新的參考基因組“揭示了對神經發育和人類疾病很重要的基因中人類遺傳變異的前所未有的水平”。
這不是結束而是新的開始
此次,T2T團隊使用的葡萄胎細胞只保留了XX染色體——一組重復的染色體,缺失了Y染色體。而完成單倍體基因組測序并不是“人類基因組計劃”的最終目標和結果,更是一個新的開始。
艾希勒稱:“我們已經完成了一個基因組。在接下來的幾年里,將會有數百甚至數千個基因組。我認為我們對人類彼此不同的看法將發生轉變,更復雜的遺傳變異不僅對了解什么使我們成為人類很重要,而且對了解什么使我們與眾不同也很重要。”
下一階段,科學家們將對多個不同個體的基因組進行測序,以充分掌握人類的多樣性、疾病以及人類與其他靈長類動物的關系。
好消息是,研究人員也即將發布來自不同來源細胞的Y染色體的完整序列。對這一新Y染色體序列的分析將出現在未來的出版物中。
此外,T2T聯盟還有一個新目標——從不同種族或血統的人中提取350個基因組(目前已破譯了70個基因組)。NHGRI基因信息學部門負責人亞當·菲利普博士說,該項目將總共花費數百萬美元或更多。但與2003年人類基因組計劃完成最終測序所花費的近4.5億美元相比,這只是一個零頭。隨著新技術的出現,測序只會變得越來越便宜。
就目前而言,對每個人來說,測序自己的基因組仍然過于昂貴和耗時,但使用全新基因組序列來確定某些基因差異是否與特定癌癥有關的研究已經在路上。
菲利普博士表示,在未來幾年內,對一個人的整個基因組進行測序應該會變得更便宜、更簡單。
“未來,當某人對其基因組進行測序時,我們將能夠識別他們DNA中的所有變異,并利用這些信息更好地指導他們的醫療保健。”菲利普說,“真正完成人類基因組序列就像戴上一副新眼鏡,現在我們可以清楚地看到一切,而我們離理解這一切意味著什么又近了一步。”
責任編輯:hnmd003
相關閱讀
相關閱讀
-
首個完整無間隙人類基因組序列出爐 助力破解最后的“黑匣子”
人類的基因組常常被比作生命的天書——A、T、G、C四種堿基構成了DNA,卻配對出超過60億種可能,足見其紛...
-
天舟四號貨運飛船成功發射 空間站建造任務首戰告捷
5月10日凌晨,天舟四號貨運飛船在西昌衛星發射中心文昌航天發射場成功發射,宣告2022年中國空間站建造任...
-
大盤縮量震蕩 個股漲多跌少權重被短線題材壓制
5月9日,A股縮量震蕩。在北向資金暫停交易下,兩市量能收窄至6718億元,創2021年4月15日以來新低。雖然...
-
12家公司撤銷退市風險警示 摘星摘帽股備受市場追捧
5月9日,*ST亞星、*ST香梨、*ST德新三家公司宣布停牌一天,均是為公司股票撤銷退市風險警示及其他風險警...
-
江蘇銀行業一季度成績耀眼 不良貸款率穩中有降
進入5月,我省銀行業一季度經營數據已經全部揭曉,數據顯示,我省銀行業一季度成績耀眼,掀起2022年開門...
-
浙江出臺全國首個個體工商戶紓困政策 紓解市場預期不穩等
進一步紓困中小微、個體企業又有新動作。疫情沖擊下,中小微企業和個體工商戶經營困難,浙江出臺全國首...
-
【觀點】制造業發展潛力歸根結底在于技術創新
中國經濟實現長期高速增長,得益于制造業的規模擴張和比重提升。在20世紀90年代開始的這一輪全球化中,...
-
江蘇出臺“助企紓困22條” 企業如何闖關前行?
為最大限度降低疫情對企業發展的影響,我省不久前出臺助企紓困22條,其中,在稅費支持、補貼補助、普惠...
-
17.53萬企業免申即享 江蘇“穩企紓困”織密民生底線
穩崗返還免申即享,智慧就業云端匹配,社會保障一卡通……為積極應對疫情對穩就業、保民生的影響,江蘇...
-
本周陽光不太熱情 南京今明最高氣溫下降至21℃
根據省氣象臺對一周天氣的預測,本周大部分時段全省云系較多,其中9日-12日,受低層弱切變影響,沿江和...
-
抖音五一旅行報告:“云游”長安十二時辰老君山,周邊游成新寵
疫情阻擋了部分人的旅行步伐,但阻擋不了人們對大自然和生活的熱愛。5月7日,抖音生活服務聯合巨量引擎...
-
行業板塊是什么意思 行業板塊和概念板塊有什么區別?
在股票板塊里,行業板塊和概念板塊是比較主流的板塊,投資者通過這兩個主流板塊來找出和市場熱點相呼應...
-
2022年廣元養老金多少錢一個月 廣元養老保險繳費比例
2022年廣元養老金多少錢一個月,下文就隨社保君來簡單的了解一下吧。(一)廣元養老保險繳費比例一般來說...
-
西藏城投是不是不夜城概念股 西藏城投市值是多少
西藏城投是不是不夜城概念股,至誠財經網為廣大投資者們帶來最新內容。西藏城投是不夜城概念股,5月9日...
-
二手奢品迎來年輕消費潮,95分App用“鑒別查驗”打通上下游產業鏈
據艾瑞咨詢測算,2020年,中國閑置高端消費品零售行業市場規模相比2016年增長超3倍;到2025年,該行業市...
-
導航概念股龍頭有哪些 四維圖新(002405)年利潤表現如何
導航概念股龍頭有哪些?四維圖新(002405):導航龍頭股,四維圖新從近五年凈利潤來看,近五年凈利潤均值為...
-
天津養老保險上調了嗎 2022天津養老金調整新消息
2022年養老金調整方案尚未出爐,參照往年公布時間,預計4月份公布,但是每年的養老金調整方式是基本不變...
-
2022年退休年齡新規有哪些 70后退休年齡表一覽
2022年70后退休年齡一覽表2022年法定退休年齡男女具體多少歲?延遲退休方案2022年正式實施表格一、退休年...
-
養老保險怎么交 城鄉居民基本養老保險個人繳費方法
一、養老保險怎么交?社保中的養老保險又分城鎮職工養老保險和城鄉居民養老保險,一個可以企業代繳,一個...
-
科創板新股申購規則是什么 申購時間及申購次數介紹
小編為投資者帶來科創板新股申購規則是什么,科創板申購條件的相關內容,投資小白們必懂的股票入門炒股...
-
海思科屬于氨酸谷氨酸概念股嗎 海思科股價表現如何
海思科屬于氨酸谷氨酸概念股嗎,至誠財經網為廣大投資者們帶來最新內容。海思科是氨酸谷氨酸概念股,5月...
-
雅安養老保險在哪里交 雅安養老保險繳費比例是多少
雅安社保繳費分為企業和個人兩種,其中個人繳納社保只能繳納養老保險和醫保,只有雅安市戶籍靈活就業人...
-
4月房企業績集體下滑 全面支持政策有待落地
百余地松綁也還沒能止住樓市的下滑,5月伊始,各大房企紛紛發布了4月的業績月報。5月8日,北京商報記者...
-
地方銀行貼息存款背后:融資顧問牽線“拉存款” 銀行負債成本提升
今年以來,不少銀行紛紛開啟大額存單、存款產品降息模式,但存款資源冷熱不均的情況依然突出。北京商報...
-
2021年逾八成醫藥企業研發費用同比增長 306家銷售費過億
對于醫藥企業來說,銷售費用及研發情況一直是市場關注的焦點。同花順iFinD數據顯示,2021年,逾八成醫藥...
-
風語筑股價走低可轉債價格支撐強勁 正股下跌可轉債不跌不正常
風語筑等公司股價不斷走低,但是可轉債價格卻在115元附近支撐強勁,可轉債的投機性從新債上市就開始顯現...
-
A股中長期價值凸顯 多方發力提振信心
剛入五月,A股市場延續震蕩。節后兩個交易日,先是開門紅,滬深兩市近4000只個股上漲;后被美股帶跌,上...
-
山東降雨范圍將擴大 全省氣溫持續走低
近日,受冷空氣影響,我省天氣突變,氣溫降幅大,8日白天,北部地區開始出現降水。記者從省氣象局了解到...
-
山東出臺實施方案 打好重點海域綜合治理攻堅戰
深入打好重點海域綜合治理攻堅戰是十四五時期污染防治攻堅戰八個標志性戰役之一。近日,省生態環境委員...
-
山東制造業貸款增加805億元 真金白銀為制造業注入金融活水
這筆授信可用6年,額度1 9億元,首筆1520萬元已經發放。4月29日,得知貸款落地,世紀開元智印互聯科技...
精彩推薦
閱讀排行
精彩推送
- 未按時履行法律義務 曼秀雷敦被...
- 用變質水果做果切 百果園上市臨...
- 抖音真正龍頭股是誰 字節跳動抖...
- 豬肉價格多少錢一斤 今日全國豬...
- 守護美麗江島 南京生態科技島“...
- 搶賽道打造產業“新地標” 高淳...
- 玉米價格多少錢一斤 今日玉米價...
- 今天北向資金為什么休市 北向資...
- 打造美麗六合!六合區累計治理水...
- “逆勢增長”的秘密——江蘇沿江...
- realme真我V23i入網工信部 水滴...
- 蘋果全新iPhone14系列曝光:4800...
- Cookies的位置在哪里 Cookies怎么刪除
- Cookies有什么用途 使用Cookie注意事項
- ASP是什么 asp是什么文件格式
- 顯卡天梯是什么 顯卡的分類有哪些
- 電子商務是什么 電子商務的優越...
- 語音識別芯片有哪些 語音識別芯...
- 計算機組件是什么 計算機組件有哪些
- 學習機哪種好 學習機有哪些功能...
- CPU如何超頻 CPU超頻具體方法介紹
- 云托管是什么 云托管服務包括哪...
- Prime95是什么 如何使用Prime95...
- SSL協議是什么 SSL協議提供的安...
- 如何使用易升升級win10 易升升...
- 網商銀行是什么 網商銀行貸款利...
- 流動性陷阱是什么 經濟陷入流動...
- 什么是DNS劫持 dns劫持如何解決
- 什么是動態IP地址 動態ip地址怎么設置
- 父母買的保險子女可以退保不?什...