一對加利福利亞雙胞胎出生后,他們的父母日益憂心:寶寶們發育緩慢,而且肌張力低。腦部掃描發現,男寶寶可能有大腦麻痹,但女寶寶卻有癲癇和震顫。醫生們百思不解。多種測試結果都無法確診兩個寶寶究竟出了什么問題。等到孩子們5歲的時候,使用左旋多巴胺——一種帕金森病藥物,療效也非常短暫。
2010年,這對雙胞胎14歲了,全基因組篩查終于揭開了謎題。雙胞胎編碼墨蝶呤還原酶(sepiapterin reductase,一種在神經遞質多巴胺和5-羥色胺合成中起作用的酶)的基因存在缺陷。醫生因此改變了治療方案,增加了5-羥色胺的服用。男孩子的行動能力有所加強,女孩也不再出現突發性抽搐了。
這樣的故事激起了學界人士使用基因篩查作為診斷工具的興趣。確實,如果檢查能篩出疾病相關的基因突變,這樣治療就更加有的放矢。
但這樣的基因測試通常不能為診斷提供多少依據,因為目前的基因測試聚焦于在特定染色體上的特定基因。在類似于雙胞胎的案例中,研究者們不得不篩查所有基因,來尋找致病基因。就目前來說,這種檢驗非常稀少。但一些大規模的研究項目正準備把全基因組篩查加入到常規醫學診斷中。
英國對于基因組醫學壯志滿懷,啟動了10萬人基因組計劃。該計劃由12年開始,贏得了英國首相David Cameron的個人支持。該計劃投資3億英鎊,對英國國民健康服務中心(National Health Service, NHS)的癌癥、少見疾病和傳染性疾病病人進行測序。該計劃旨在尋找疾病的致病基因,為臨床提供更好的診斷工具,為病人提供個性化治療,最終促進英國基因產業。
John Bell認為,英國衛生醫療系統是國家資金支持的,因此非常適合執行這種大規模的基因組醫學實驗。Bell是牛津大學(University of Oxford)的醫學研究者,同時也是Genomic England公司的董事。Genomic England是英國國民健康服務中心附屬的一家公司,是10萬人基因組計劃的主要實施公司。NHS有非常詳細的病人信息,將這些與基因篩查結果聯系起來,能更清楚地認識到疾病和基因之間的聯系。Bell指出,多種證據表明,全基因組篩查能夠幫助診斷和治療多種疾病,NHS希望能把全基因組篩查作為常規醫學手段。
但在這個目標實現以前,10萬人基因組計劃必須克服幾個問題。從這么多人身上提取DNA樣本本身就是一件繁瑣的事情,除此之外,確定哪些基因突變是致病的,哪些是無害的也是一件棘手的事情。這需要大量的數據、時間,還需要專門的軟件來干這些事情。
支持者眾多
冰島是第一個啟動大規模全基因組分析計劃的國家。很多國家也抱著將疾病和基因聯系在一起的美好愿景,加入到了基因組篩查的隊伍中。在美國,精準醫療計劃打算測試100萬志愿者的基因組,而百萬老兵項目則計劃對百萬名老兵進行基因測序。而其他多個國家,包括加拿大、澳大利亞、日本、韓國、新加坡、泰國、以色列、科威特、卡塔爾、比利時、愛森堡和愛沙尼亞也紛紛開展基因篩查項目。
但英國的10萬人基因組計劃看起來最有希望:它已經成功募集了3500名罕見疾病患者和2000個癌癥病人,未來只需要找到75000名志愿者(其實基本都是這些患者的親屬)就夠了。罕見疾病患者和他們的家人最后會有5萬人。80%的罕見疾病是家族遺傳的,因此受影響者(通常是兒童)的基因可以和他血緣最近的親屬的結果進行對比。癌癥病人及其家屬會組成另外的25000名志愿者。癌癥病人的基因組會測兩次,和父母的正常細胞進行對比。因此,英國基本已經找齊了他們所需的志愿者。
志愿者們希望,基因篩查結果能讓他們更清楚地了解自己的狀況。這些信息對于整個病人群體都有重要意義。一個前列腺癌患者的基因組,經過與數據庫的對比,可以提供前列腺癌相關的基因信息。醫生從這個患者的治療中,了解到對于具有類似基因的患者采用哪種治療最為有效。
企業合作者
Genomics England現在正在挑選每一步(從提取DNA到解讀基因組)的企業合作者。總部在圣地亞哥的測序儀器生產商Illumina負責測序工作,同時也負責鑒別基因突變。這由Illumina在英國小切斯特福德的分公司進行。但在未來幾個月里,計劃開始擴大范圍時,Illumina計劃把測序儀器搬到英國斯頓的維康信托基因組園區(Wellcome Trust Genome Campus)。
Illumina通過高通量測序儀器處理提取的DNA樣本,獲得小段的堿基片段。這些片段通過電腦計算,重組成連續的序列,然后通過生物信息學,科學家們會把生成的結果和人類參照基因組(由國際基因組參照協會(Genome Reference Consortium)不斷更新的人類代表性基因組)進行對比,目的是發現和參照基因組不同的序列片段,也就是突變。
為了鑒別這些突變,Illumina團隊使用該公司的Isacc工作流程(一種開源的計算基因組排布和識別變體的工具)。然后,為了鑒別每個基因組的幾百個變異中哪一個致病,Genomics England公司會在數據中心收集10萬人的基因信息,然后進行分析。但Genomics England還沒有決定選擇哪個軟件來實施這一工作:需要和Illumina和學界一起檢驗各個軟件的可靠性,然后改善現有的識別變體的算法,最后再確定選擇哪個軟件。
Illumina已經對3000多個樣本進行了測序,但每天有更多的樣本涌入。Peter Formen,Illumna10萬人基因組計劃的管理主任表示,針對突變分析,他們打算收集和上報生殖細胞和體細胞NDA中特定位點的的多種變體。變體包括增加或缺少幾個核苷酸,或是以一種核苷酸替代了另一種。也可能有結構性的變體,例如一個基因拷貝數變異。
緊接著,每個變體和已有的變體數據庫,例如dbSNP庫(一個由美國國立衛生研究院(NIH)建立的,針對短基因突變的數據庫)進行對比。類似的數據庫還有很多,包括:全球千人基因組計劃也建立了全球人類基因變異的目錄;Exome Aggregation Consortium (ExAC),一個外顯子測序數據庫(外顯子是負責編碼蛋白的全部DNA序列);以及ClinVar,NIH建立的變異與相關生理狀況的數據庫。發現這些變體的作用是下個階段的任務,各個公司都踴躍申請承擔這項任務。2014年春天,Genomics England對全球的基因組階段專家進行了評價。28家參評公司需要對15個罕見疾病患者和兩個健康人的基因,以及同一個病人的10個腫瘤DNA和正常DNA進行分析,然后給出變異注解(確定基因和其蛋白產物)和解讀(把基因、蛋白和功能聯系在一起)。
表現最佳的公司可以接受一個測試,為8000個志愿者進行基因組解讀的工作。Genomics England從28家公司中挑出了表現最佳的4家,這4家需要通過這個測試,并簽訂協議。這四家公司分別是英國劍橋的Congenica和美國加利福利亞的Omicia,他們會分析罕見疾病患者的基因組;加利福利亞的Nanthealth,他們會分析癌癥基因;麻省的Wuxi NextCode公司,他們既要分析罕見疾病又要分析癌癥。圣地亞哥的Cypher Genomics公司及其合作伙伴高級技術和防衛公司Lockheed Martin則是候選公司。這些公司此前都有相關領域的從業經驗。
所有公司都會使用高效能計算來解讀基因數據,并且工作場所都是Genomics England的安全數據中心。目的是提供幾乎全自動的服務——解讀下一代測序數據目前主要是人工操作,需要花費數小時到數周的時間。據Genomics England生物信息部門的領導Augusto Rendon表示,最忙的時候,每天有200多個基因組的數據需要處理。如果要按時地、不超預算地完成計劃,如果想把全基因組測序作為常規診療手段,那么人工解讀必然無法達到要求。
花落誰家
每個公司都帶來了自己的專家團隊來完成基因組解讀任務。Congenica,是維康信托桑格研究所(Wellcome Trust Sanger Institute)和英國衛生部(Wellcome Trust Sanger Institute)的下屬公司,之前一直為NHS提供測序服務。它會分析疾病相關的遺傳性和獲得性的稀有基因突變。它開發的Sapientia平臺已經在“解密發育疾病項目”(Deciphering Developmental Disorders, DDD)中投入使用,對12000名兒童進行基因測序。DDD是迄今為止全世界最大規模的、全國性的、罕見疾病測序項目。Congenicad 首席運營官Tom Weaver表示,這項研究對30%-40%的參與兒童做出了診斷,這些兒童患有無法確診的出生缺陷或認知缺陷。
美國的Omicia公司在基因組的臨床解讀上也有很多經驗,但它之前使用的是開放源碼、開放獲取的工具。在10萬人基因組計劃中,它將會使用Opal的基因解讀軟件,來預測哪個變體可能導致疾病。該公司的Phevor算法(表型驅動編譯本體論重排序工具)能把突變可能與疾病相關的概率,與基因功能現行和信息的數據庫相結合。Omicia可利用這一工具將病人的表型(也就是病理表現)也結合起來。Omicia的首席科學家Martin Reese表示,這些高度自動化的工具意味著,Omicia可以避免人工解讀信息。這些算法能夠把變體歸類到已知的致病基因中,這些基因與疾病的聯系部分已知,部分仍待證實。隨后Opal會把這些結果整合在一起,匯總成報告,幫助醫生形成治療意見。
Cypher Genomics是斯克里普斯研究所(Scripps Research Institute)的下屬公司,開發過Mantis基因解讀軟件。Mantis能夠根據變體致病的概率進行排序。Cypher Genomics的首席運營官Adam Simpson表示,根據Mantis的分析結果,科學家們可以優先選擇研究的變體對象。
最后要談到Wuxi NextCode公司了。Wuxi NextCode是冰島基因公司deCODE的衍生公司。deCODE由Kari Stefansson于1996年創立。Kari Stefansson率先提出,獲取全國人民的基因信息,來尋找致病基因的理念。后來deCODE被制藥公司Amgen收購時,一幫生信學家和deCODE的前職工創立了Wuxi NextCode。Wuxi NextCODE在2015年1月被中國上海藥明康德公司收購。
Wuxi NextCode的結果并不是一張可能引起疾病的突變清單。Wuxi NextCode的首席科學家Jeff Gulcher表示,全球的臨床醫生和研究人員都可以通過任何網絡瀏覽器,在單個堿基分辨率上實時存儲、查看和分析基因數據,并且軟件不斷更新最新的變異信息。
Gulcher表示,一個典型的問題可能是“我想知道,這到底是不是變異”。這意味著,需要尋找患有相同罕見疾病的個體,看看他是否也有相同的突變體。總有一天,醫生可能想知道癌癥病人是否有類似的變體和病程發展,同時想了解過去十年的此類病人采用的治療。Gulcher表示,Wuxi NextCODE的Genomically Ordered Rela -tional Database數據庫可以完美地實現這類需求。
另一方面,基因學家可能需要比較20個基因組,每個有一百萬個變體。他需要知道的是,哪個是致病變體。Wuxi NextCODE的數據庫根據基因位置來顯示變體,從而不需要對所有基因從頭到尾進行比較分析,提高處理效率。Wuxi NextCode的首席運營官Hannes Smarason表示,該平臺非常適應處理大量信息,例如30萬冰島人的基因組信息。
Nanthealth是私營企業,主攻癌癥基因組信息的計算分析,為臨床治療提供指導。Nanthealth拒絕提供信息,但它的主頁上顯示,該公司分析了超過2萬個基因樣本。該公司由醫生和生物醫學研究者Patrick Soon-Shiong創立。Patrick Soon-Shiong還是一個基金會的主席,該基金會致力于消除醫療資源不平等,并支持研究。同時他還是一個非營利性研究機構的負責人,該研究結構致力于促進電子分子診斷。他研發了抗癌藥物Abraxane,該藥物能夠治療多種癌癥。
對于Genomics England來說,整個項目旨在為臨床提供指導。但在把結果反饋給醫生和家屬之前,科學家和醫生們需要先仔細研究這些數據。Genomics England 募集了2000名專攻13種罕見疾病和10種癌癥的醫生和科學家,來完成質量檢驗工作。同時他們也需要研究項目成果,特別是審查基因和疾病的聯系是否明確。他們會通過細胞檢驗和小鼠實驗來研究變體是如何影響和誘發疾病的,這些信息都會匯總到10萬人基因組計劃。一些結果可通過數據庫很快證實,而另一些結果則需要通過文獻、軟件和實驗來謹慎驗證。
Bell表示,NHS并不以技術創新出名,但Genomics England可能會改變這一形象。10萬人基因組計劃對整個基因領域造成了重大影響。它將提供很多商業和學術機會,甚至有可能實現將基因組運用到臨床上,從而造福全人類的偉大目標。
原文檢索:
Vivien Marx. (2015) The DNA of a nation. Nature, 524(7565): 503-505.