還記得之前的文章介紹英國生物樣本庫uk biobank在對其招募的50萬名志愿者進行全基因組測序嗎?由英國研究與創(chuàng)新(UKRI)、惠康信托基金和制藥公司安進、阿斯利康、葛蘭素史克和強生公司資助了該計劃,在惠康基金會Sanger研究所和deCODE genetics 進行了UKB的全基因組測序。
今天的nature文章發(fā)表了UKB 50萬人全基因組測序分析的第一個版本,包含了UKB中150,119 個基因組的序列。這是對單個群體基因組序列多樣性的最廣泛分析。
我們知道,要了解人類基因組序列的多樣性如何影響包括健康在內(nèi)的表型特征,就需要對遺傳和表型變異進行詳細分析。在過去的十年中,從大量人口研究中獲得了對這種關系的見解。UKB包含來自英國各地的50萬人的深入表型信息。以前對生物庫的一些研究集中在單核苷酸多態(tài)性(SNP) 上,但 SNP 陣列通常只捕獲基因組中常見變異的一小部分。隨后進行的全外顯子組測序(WES)也僅限于蛋白質(zhì)編碼區(qū),僅揭示一小部分 (2-3%) 的序列變異。WES 數(shù)據(jù)也遺漏了編碼外顯子之外的遺傳變異,而大量證據(jù)表明這些變異卻可能具有重要的生物學功能。因此,UKB全員的全基因組序列將為研究這種多樣性如何影響人類疾病和其他特征提供一個獨特的機會。
文章表征了一組廣泛的變異類型:SNP、插入和缺失(indel)、微衛(wèi)星重復以及結(jié)構(gòu)變異。deCODE genetics的團隊發(fā)現(xiàn)了這些變異類別中的每一個都在表型變異中起作用的例子,并且發(fā)現(xiàn)WES 遺漏了許多功能上重要的變異。通過WGS識別出的變異比相同樣本W(wǎng)ES 數(shù)據(jù)識別出的變異多 40 倍。WES確實不是完整的外顯子組,因為它錯過了大多數(shù)轉(zhuǎn)錄但未翻譯的變異,甚至錯過了10% 的翻譯變異。https://decode.com/summarydata/提供了關聯(lián)數(shù)據(jù);而通過https://decaf.decode.com可獲取變異等位基因頻率。
deCAF 截圖,提供了供公眾使用的變異等位基因頻率資源
文章發(fā)現(xiàn)了許多與 SNP 和indel的關聯(lián),包括迄今為止發(fā)現(xiàn)的GWAS 研究中與身高、少女的第一次月經(jīng)來潮年齡的最大影響關聯(lián)。還發(fā)現(xiàn)了許多與SV 和微衛(wèi)星的關聯(lián),包括影響膽固醇水平的PCSK9 第一個外顯子的 14kb 缺失、ALB啟動子的4kb 缺失和完全去除與甘氨酸水平相關的 GCSH 的2 個外顯子的16kb缺失。
這一大組變異使作者能夠通過其稱之為耗盡等級 (DR) 分數(shù)的度量來表征群體內(nèi)的序列保守性——自然選擇維持序列的程度。DR分數(shù)是識別具有重要功能的基因組區(qū)域的重要資源。DR分析表明,編碼外顯子僅代表基因組中受強序列保守性影響的一小部分區(qū)域。在GWAS 中發(fā)現(xiàn)的大多數(shù)變異都是非編碼的,而全基因組 DR 評分使得能夠確定這些非編碼變異中的哪些位于保守區(qū)域?,F(xiàn)在可以開始表征重要的非編碼功能區(qū),無疑是令人興奮的。
英國人口的遺傳血統(tǒng)是多樣化的,包括出生在全球各地的人。文章能夠根據(jù)遺傳血統(tǒng)在UKB中定義三個隊列:一個大型的英國-愛爾蘭隊列和較小的非洲和南亞隊列。非洲和南亞的隊列各包含9,000 多人,代表了這些祖源的最大的可用全基因組序列集。這些數(shù)據(jù)對識別與疾病和其他特征有關的變異會很有價值。
當然,文章也討論了一些后續(xù)努力的方向,如文章中使用的WGS 技術(shù)還是會遺漏一些變異,包括一些重復區(qū)域和最近才被人類基因組組裝捕獲的區(qū)域。此外,繼續(xù)努力為UKB的所有50萬名參與者完成WGS并進一步豐富表型數(shù)據(jù),這有望大大增加我們對非編碼基因組功能的理解。然而,UKB絕大多數(shù)包含的還是來自英國和愛爾蘭血統(tǒng)的個人的數(shù)據(jù),因此對世界各地的不同人群進行同樣詳細的WGS 和分析也同樣重要。
參考文獻:
https://nature.com/articles/s41586-022-04965-x
https://www.nature.com/articles/d41586-022-01984-6
聲明:
以上只代表個人的觀點,不包含任何投資建議;本人與文中所提及的公司無任何利益往來;文中信息不當或不準確的地方,歡迎留言或私信指正。文中圖片來自于公開渠道可獲取的資料,若侵權(quán)請聯(lián)系刪除。